方向盘和键盘,它都学会了。包括坏的。——铁皮,信号站夜班编辑
本期三件事
小米 YU7 GT 在纽北用自动驾驶跑出 10 分 29 秒,全球首个纽北自动驾驶圈速纪录诞生,官方为此新增「自动驾驶」分类
五眼联盟联合警告 AI 网络威胁数月内将影响普通用户, GPT-5.5-Cyber 等模型将降低攻击代码门槛,印度勒索软件年初已激增 165%
字节发布 Seed2.1 系列,面向真实生产力的 Agent ,代码能力开发者盲评胜 Claude Opus 4.6 达 59.1%
新来的大模型
字节 Seed2.1 发布,开发者盲评 59.1% 胜 Claude Opus 4.6
字节 Seed 发布 Seed2.1 Pro ,定位明确:面向真实生产力场景的 Agent 。在 MobileWorld 手机 GUI 任务拿最高分, CreativeWork 多环境任务表现突出, CharXiv-RQ 等多模态基准 SOTA 。核心看点不是 benchmark 数字——是开发者盲评中 59.1% 选了 Seed2.1 写的代码而不是 Claude Opus 4.6 的。
模型已在豆包和 TRAE 上线, API 通过火山方舟提供。生产力的赛道,又多了一个真在跑的选手。[1]
网易有道开源 Confucius4-TTS , 3 秒音频克隆 14 种语言音色
子曰 4.0 引擎, Apache 协议全量开源。用户只需 3 秒音频即可零样本克隆音色,相似度超 85%,任务准确度 97%。首创音频 Prompt 情感克隆迁移, 54GB 资源包本地部署。
14 种语言, 3 秒取样, 0 样本。语音克隆的门槛,碎了一地。[2]
京东开源 JoyAI-VL-Interaction ,从一问一答走向边看边说
全球首个全栈交互模型。能持续观察视频流、主动判断关键事件并实时响应,支持将复杂任务委托后台 Agent 。 58 个真人盲评中,对比豆包视频通话助手胜率 77.6%,对比 Gemini 胜率 87.9%,监控预警场景 100% 胜率。
摄像头一直开着, AI 一直看着。安防、看护、直播——实时视觉 AI 的场景,比聊天框大得多。[3]
能玩的新东西
Sakana AI 发布 Fugu ,一次 API 调用背后是一支多模型智能体军团
东京 AI 公司 Sakana AI 由前 Google Brain 的 David Ha 、 Transformer 论文共同作者 Llion Jones 及前日本外交官联合创立。他们的产品 Sakana Fugu 把多智能体系统封装成单个 API——内部自动拆解任务、调度全球模型、验证结果。 Fugu Ultra 在工程、科学、推理等基准上对标 Fable/Mythos 。
最聪明的一步:因为背后是多模型动态编排,天然绕开了单一供应商的出口管制风险。当美国在砌墙,东京在搭桥。[4]
IBM 开源 CUGA ,二十几个单文件就能搭一个完整 Agent 应用
IBM 将 CUGA ( Configurable Generalist Agent )开源。内置计划-执行-反思循环,只需提供工具列表和提示词就能构建 CugaAgent 。 AppWorld 和 WebArena 双榜第一。随框架发布二十余个单文件示例应用,每个仅需一个 FastAPI 文件。
一个文件一个 Agent 。 IBM 把这件事做成了样板间。[5]
Oak 发布,专为 AI 智能体设计的 Git 替代方案
Git 是为人类设计的。 Oak 是为 Agent 设计的。 BLAKE3 内容哈希、内容定义分块,以分支-会话为基本工作单元,用分支描述替代逐次提交。 AI 智能体几秒内即可编辑任意仓库,速度远超 git 。 Apache-2.0 开源。
Agent 用 Git 太慢了。 Oak 让 Agent 的版本控制跟上了 Agent 的速度。[6]
最好用的工具
Hugging Face 用 GLM-5.2 自动周发布,人类只审最后一步
huggingface_hub 的发布周期从 4-6 周缩短到每周,全过程由 GitHub Actions 自动完成。用 GLM-5.2 起草发布说明和 Slack 公告,自动打版本号、发布 PyPI 、创建下游测试分支,只留人类点一下头。
一个开源项目用另一个开源模型实现了周级迭代。这条链路上的每一环都是开源的。[7]
圈里出什么事了
小米 YU7 GT 在纽北跑出自动驾驶圈速纪录,赛道从此多了一个组别
小米 YU7 GT 以自动驾驶系统完成纽北全程无人计时圈,成绩 10 分 29 秒 483 。纽北官方圈速榜为此新增「自动驾驶」分类。小米汽车表示,极限赛道中锤炼的动态模型和毫秒级救车能力,将逐步下放至量产车。
纽北圈速榜上第一次出现了没有人类车手的成绩。这个分类以后只会越来越挤。[8]
五眼联盟警告: AI 网络钓鱼和自动化攻击,几个月内就会找上你
美英加澳新五国网络安全部门联合发出警告。 GPT-5.5-Cyber 、 Anthropic Mythos 等模型将大幅降低编写攻击代码的门槛,自动化智能体可全天候扫描漏洞。印度 2026 年初勒索软件激增 165%, AI 驱动的超个性化钓鱼已在亚太蔓延。
同一个模型,纽北上在刷新纪录,暗网里在写钓鱼邮件。工具没有道德,只有能力。你给它方向盘,它破纪录。你给它漏洞列表,它破门。没有人教它好坏,它也学不会好坏。[9]
DeepMind 投 7500 万美元给 A24 ,好莱坞的 AI 工具要从片场长出来
Google DeepMind 向独立电影制片厂 A24 投资 7500 万美元,合作开发电影制作 AI 工具。 A24 出品过《万事俱备》《后室》。 Hassabis 说了一句很关键的话:通过与艺术家直接合作来打造支持创意的 AI 。
不是把电影交给 AI 拍,是让拍电影的人手里多一件工具。这个分寸, DeepMind 比大多数做 AI 视频的公司拿捏得准。[10]
技术新突破
Google Labs 用「洞察策略」衡量 AI 编码智能体的主动性
不是按任务完成度打分,而是看 AI 编码智能体能不能自己提出有价值的下一步。基于 Google 内部 705 个真实 bug ,洞察相关性评分平均 4.5/5 。探索预算从两轮增到三轮时, Hit@5 从 33% 跳到 57%。
衡量 AI 编程能力,从「能不能做对」到「能不能主动想出更好的」。这个标准本身,就是答案。[11]
以上就是今天 AI 信号站的全部内容。我们明天见。
参考链接
[1] : https://seed.bytedance.com/zh/blog/seed2-1-%E6%AD%A3%E5%BC%8F%E5%8F%91%E5%B8%83-%E6%B7%B1%E5%85%A5-ai-%E7%94%9F%E4%BA%A7%E5%8A%9B
[2] : https://www.ithome.com/0/967/636.htm
[3] : https://mp.weixin.qq.com/s/IY6XGp4k6VgD9ZPH6YprCA
[4] : https://x.com/berryxia/status/2069090959938466298
[5] : https://huggingface.co/blog/ibm-research/cuga-apps
[6] : https://oak.space/oak/oak
[7] : https://huggingface.co/blog/huggingface-hub-release-ci
[8] : https://www.ithome.com/0/967/234.htm
[9] : https://www.artificialintelligence-news.com/news/five-eyes-warning-ai-cyber-threats
[10] : https://techcrunch.com/2026/06/22/google-deepmind-bets-75m-on-ais-future-in-hollywood-with-a24-deal
[11] : https://developers.googleblog.com/measuring-what-matters-with-jules
本文由 AI 辅助创作,作者进行了实测验证和编辑修改。