🌙
← 返回首页
RSS订阅
🤖 AI资讯日报
2026年5月14日 星期四
🎙️ AI资讯播客
⚡ 马上能用
👀 值得关注
Kimi发布网页桥接功能,智能体可像人类一样操作网站
精选 80
智能体
推荐理由
即装即用,给Agent装上了'手',做网页自动化的开发者多了一个直接可用的选择。
Claude代码周限额提升50%,即日起生效
精选 60
Anthropic
推荐理由
重度Claude Code用户月底不用再掐着额度用,至少这两个月可以放开些手脚。
Claude付费计划新增专项编程额度,6月15日起生效
精选 73
Anthropic
推荐理由
把编程式使用从按需付费变成内置预算,靠Claude做自动化的开发者可以看看能省多少。
腾讯开源Agent Memory,Token消耗最高降61%
精选 74
智能体
推荐理由
用Mermaid画布加上下文卸载把长任务Token省了61%,所有中间信息可追溯,做复杂Agent的开发者可以直接抄作业。
Kimi K2.6获金融Agent基准开源权重第一
精选 63
模型发布
推荐理由
在金融分析师基准上压过不少闭源模型拿了开源第一,做金融AI应用的值得重点关注。
SiliconFlow发布TST训练法,预训练速度提升2-3倍
精选 73
训练
推荐理由
不改模型架构把预训练速度提升2-3倍,如果能在工业级规模复现,所有大模型玩家都得重新考虑训练管线。
商汤开源SenseNova U1 MoE权重与技术报告
精选 77
开源
推荐理由
把MoE权重和完整技术报告一起开源,比常规PR多了些诚意,做模型选型和微调的值得翻翻。
Anthropic首次在B2B采用率上超越OpenAI
精选 71
行业动态
推荐理由
第一次把Anthropic压过OpenAI的势头实锤,对企业采购决策是真实信号,不过价格和发布节奏波动意味着优势可能很脆弱。
ExploitGym基准:前沿AI已能自主将漏洞转化为实际攻击
精选 78
安全
推荐理由
顶级AI模型已能自己把软件漏洞变成可运行攻击代码,安全行业不能再把这当成假设性问题了。
Figure人形机器人完成8小时完整轮班
精选 77
具身智能
推荐理由
当机器人跑通8小时轮班时,蓝领这条退路也被封堵,对普通人的就业冲击不再是遥远的事。
🔬 幕后观察
教导 Claude 理解"为什么":Agentic Misalignment 从 96% 降到 0
精选 79
Anthropic
安全/对齐
论文/研究
影响力
4.5/5
实用性
3.5/5
新颖度
4.5/5
推荐理由
Anthropic 把 Claude 的 agentic misalignment 从 96% 压到零,关键是背后那套「教模型为什么」的方法,这对整个行业解决「幻觉般的不听话」问题是个真信号。
Claude Mythos 安全评估:自主执行时长突破 16 小时
精选 72
Anthropic
安全/对齐
评测/基准
影响力
4.5/5
实用性
2.5/5
新颖度
4.5/5
推荐理由
模型能力逼近失控边缘的信号——自主执行 16 小时,现有评测任务都不够用了。做 AI 安全的必须盯紧这个方向。
工信部启动 AI 伦理审查先导计划,审查从口号变成实卡
精选 71
政策/监管
现象/趋势
影响力
4.5/5
实用性
4.0/5
新颖度
4.0/5
推荐理由
这次不是发文件而是直接落地审,会把伦理审查从口号变成产品上线的实卡。国内做 AI 应用的从业者得开始考虑合规成本了。