AI News Daily

AI 日报 — 2026-06-13

约 15 分钟阅读

AI 日报 — 2026-06-13

今日要闻

今日最大事件是 美国政府以国家安全为由,要求 Anthropic 立即全球禁用 Claude Fable 5 与 Mythos 5。Anthropic 已切断所有公开访问,包括付费企业用户和海外员工。这一动作与 Claude Fable 5 在 FrontierMath 最难题目上以 88% 准确率领先 GPT-5.5 13 个百分点 形成刺眼对照:能力越强,监管来得越快。与此同时,Moonshot AI 开源 Kimi K2.7 Code,以 1/12 价格挑战闭源模型;LangGraph 曝出 RCE 漏洞链,则让 Agent 安全问题从模型层下沉到框架层。

分类导读

🏢 AI 产业与治理

评级来源标题摘要
★★★VentureBeatAnthropic blocks all public access to Claude Fable 5, Mythos 5 following US government order美国政府以出口管制指令要求 Anthropic 暂停所有外国公民访问 Fable 5 / Mythos 5,Anthropic 已全球下架两者
★★☆The DecoderUS government forces Anthropic to disable Claude Fable 5 and Mythos 5 for all customers worldwideAnthropic 公开反驳称漏洞轻微且竞品同样存在,警告此举可能开创 Frontier 模型全面停摆先例
★★☆The DecoderMicrosoft CEO Satya Nadella admits he’s a token-maxer, too: “It’s addictive”Nadella 警告不要把 Frontier 模型浪费在日常任务上,边际生产力收益必须匹配 token 成本
★★☆The DecoderMeta shifts from “tokenmaxxing” to token managing as internal AI costs reportedly hit billionsMeta 内部 AI 使用成本将达数十亿美元,2027 年起通过 AI Gateway 统一管控 token 消耗
★★☆Reddit / r/artificialOpenAI Faces Multi-State Probe as US Attorneys General Demand Records on Safety and User Impact美国多州检察长对 OpenAI 发起调查,要求提供安全与用户影响记录

🔥 LLM 训练与架构

评级来源标题摘要
★★★The DecoderClaude Fable 5 outpaces GPT-5.5 by 13 points on FrontierMath’s toughest problemsFable 5 在 FrontierMath 最难层级达到 88% 准确率,而 Opus 4.5 年初还不到 10%,数学推理能力跃进明显
★★★MarkTechPostMoonshot AI Releases Kimi K2.7-Code: a Coding Model Reporting +21.8% on Kimi Code Bench v2 Over K2.6Moonshot 开源 Kimi K2.7-Code,256K 上下文、推理 token 降低约 30%,对 GPT-5.5 / Claude 有最高 12 倍价格优势
★★☆The DecoderGoogle Research’s Gemini-SQL2 tops text-to-SQL benchmarks by a wide margin基于 Gemini 3.1 Pro 的 Gemini-SQL2 在 BIRD 基准达到 80.04%,大幅领先 OpenAI 与 Anthropic

🤖 Agent 与 AI Engineering

评级来源标题摘要
★★☆The DecoderMicrosoft’s SkillOpt boosts GPT-5.5 by using nothing but a trained Markdown file微软与中科大等提出 SkillOpt,仅用一个训练过的 Markdown 指令文件就在程序化任务上提升 GPT-5.5 约 23 分,且可跨模型与 Agent 环境迁移
★★☆Dev.toLangGraph RCE Chain: How Malicious Tool Calls Escalate to Full Host CompromiseLangGraph 自托管部署曝出漏洞链,攻击者可通过恶意 tool call 实现完整主机 RCE,Agent 框架安全需引起重视
★★☆Towards Data ScienceParse PDFs for RAG Locally with Docling: Rich Tables, No Cloud Upload使用 Docling 在本地解析 PDF 表格、OCR、标题等结构,无需云端上传即可为 RAG 提供高质量文档理解

🎨 多模态与行业应用

评级来源标题摘要
★★☆新智元刚刚,GPT-5.5被中国纯血AI反超了!讯飞星火医疗大模型 V3.5 发布,医生采纳率 91%、病历书写时间缩短 52%,在医疗场景落地指标上超越 GPT-5.5

统计


[The Decoder] US government forces Anthropic to disable Claude Fable 5 and Mythos 5 for all customers worldwide · [The Decoder] Claude Fable 5 outpaces GPT-5.5 by 13 points on FrontierMath’s toughest problems · [MarkTechPost] Moonshot AI Releases Kimi K2.7-Code · [The Decoder] Microsoft’s SkillOpt boosts GPT-5.5 · [Dev.to] LangGraph RCE Chain