当前位置：首页>自动驾驶>小米在纽北刷了自动驾驶纪录,五眼联盟说 AI 学会了写钓鱼邮件

小米在纽北刷了自动驾驶纪录,五眼联盟说 AI 学会了写钓鱼邮件

2026-06-24 10:03:20

方向盘和键盘，它都学会了。包括坏的。——铁皮，信号站夜班编辑

本期三件事

小米 YU7 GT 在纽北用自动驾驶跑出 10 分 29 秒，全球首个纽北自动驾驶圈速纪录诞生，官方为此新增「自动驾驶」分类

五眼联盟联合警告 AI 网络威胁数月内将影响普通用户， GPT-5.5-Cyber 等模型将降低攻击代码门槛，印度勒索软件年初已激增 165%

字节发布 Seed2.1 系列，面向真实生产力的 Agent ，代码能力开发者盲评胜 Claude Opus 4.6 达 59.1%

新来的大模型

字节 Seed2.1 发布，开发者盲评 59.1% 胜 Claude Opus 4.6

字节 Seed 发布 Seed2.1 Pro ，定位明确：面向真实生产力场景的 Agent 。在 MobileWorld 手机 GUI 任务拿最高分， CreativeWork 多环境任务表现突出， CharXiv-RQ 等多模态基准 SOTA 。核心看点不是 benchmark 数字——是开发者盲评中 59.1% 选了 Seed2.1 写的代码而不是 Claude Opus 4.6 的。

模型已在豆包和 TRAE 上线， API 通过火山方舟提供。生产力的赛道，又多了一个真在跑的选手。^[1]

网易有道开源 Confucius4-TTS ， 3 秒音频克隆 14 种语言音色

子曰 4.0 引擎， Apache 协议全量开源。用户只需 3 秒音频即可零样本克隆音色，相似度超 85%，任务准确度 97%。首创音频 Prompt 情感克隆迁移， 54GB 资源包本地部署。

14 种语言， 3 秒取样， 0 样本。语音克隆的门槛，碎了一地。^[2]

京东开源 JoyAI-VL-Interaction ，从一问一答走向边看边说

全球首个全栈交互模型。能持续观察视频流、主动判断关键事件并实时响应，支持将复杂任务委托后台 Agent 。 58 个真人盲评中，对比豆包视频通话助手胜率 77.6%，对比 Gemini 胜率 87.9%，监控预警场景 100% 胜率。

摄像头一直开着， AI 一直看着。安防、看护、直播——实时视觉 AI 的场景，比聊天框大得多。^[3]

能玩的新东西

Sakana AI 发布 Fugu ，一次 API 调用背后是一支多模型智能体军团

东京 AI 公司 Sakana AI 由前 Google Brain 的 David Ha 、 Transformer 论文共同作者 Llion Jones 及前日本外交官联合创立。他们的产品 Sakana Fugu 把多智能体系统封装成单个 API——内部自动拆解任务、调度全球模型、验证结果。 Fugu Ultra 在工程、科学、推理等基准上对标 Fable/Mythos 。

最聪明的一步：因为背后是多模型动态编排，天然绕开了单一供应商的出口管制风险。当美国在砌墙，东京在搭桥。^[4]

IBM 开源 CUGA ，二十几个单文件就能搭一个完整 Agent 应用

IBM 将 CUGA （ Configurable Generalist Agent ）开源。内置计划-执行-反思循环，只需提供工具列表和提示词就能构建 CugaAgent 。 AppWorld 和 WebArena 双榜第一。随框架发布二十余个单文件示例应用，每个仅需一个 FastAPI 文件。

一个文件一个 Agent 。 IBM 把这件事做成了样板间。^[5]

Oak 发布，专为 AI 智能体设计的 Git 替代方案

Git 是为人类设计的。 Oak 是为 Agent 设计的。 BLAKE3 内容哈希、内容定义分块，以分支-会话为基本工作单元，用分支描述替代逐次提交。 AI 智能体几秒内即可编辑任意仓库，速度远超 git 。 Apache-2.0 开源。

Agent 用 Git 太慢了。 Oak 让 Agent 的版本控制跟上了 Agent 的速度。^[6]

最好用的工具

Hugging Face 用 GLM-5.2 自动周发布，人类只审最后一步

huggingface_hub 的发布周期从 4-6 周缩短到每周，全过程由 GitHub Actions 自动完成。用 GLM-5.2 起草发布说明和 Slack 公告，自动打版本号、发布 PyPI 、创建下游测试分支，只留人类点一下头。

一个开源项目用另一个开源模型实现了周级迭代。这条链路上的每一环都是开源的。^[7]

圈里出什么事了

小米 YU7 GT 在纽北跑出自动驾驶圈速纪录，赛道从此多了一个组别

小米 YU7 GT 以自动驾驶系统完成纽北全程无人计时圈，成绩 10 分 29 秒 483 。纽北官方圈速榜为此新增「自动驾驶」分类。小米汽车表示，极限赛道中锤炼的动态模型和毫秒级救车能力，将逐步下放至量产车。

纽北圈速榜上第一次出现了没有人类车手的成绩。这个分类以后只会越来越挤。^[8]

五眼联盟警告： AI 网络钓鱼和自动化攻击，几个月内就会找上你

美英加澳新五国网络安全部门联合发出警告。 GPT-5.5-Cyber 、 Anthropic Mythos 等模型将大幅降低编写攻击代码的门槛，自动化智能体可全天候扫描漏洞。印度 2026 年初勒索软件激增 165%， AI 驱动的超个性化钓鱼已在亚太蔓延。

同一个模型，纽北上在刷新纪录，暗网里在写钓鱼邮件。工具没有道德，只有能力。你给它方向盘，它破纪录。你给它漏洞列表，它破门。没有人教它好坏，它也学不会好坏。^[9]

DeepMind 投 7500 万美元给 A24 ，好莱坞的 AI 工具要从片场长出来

Google DeepMind 向独立电影制片厂 A24 投资 7500 万美元，合作开发电影制作 AI 工具。 A24 出品过《万事俱备》《后室》。 Hassabis 说了一句很关键的话：通过与艺术家直接合作来打造支持创意的 AI 。

不是把电影交给 AI 拍，是让拍电影的人手里多一件工具。这个分寸， DeepMind 比大多数做 AI 视频的公司拿捏得准。^[10]

技术新突破

Google Labs 用「洞察策略」衡量 AI 编码智能体的主动性

不是按任务完成度打分，而是看 AI 编码智能体能不能自己提出有价值的下一步。基于 Google 内部 705 个真实 bug ，洞察相关性评分平均 4.5/5 。探索预算从两轮增到三轮时， Hit@5 从 33% 跳到 57%。

衡量 AI 编程能力，从「能不能做对」到「能不能主动想出更好的」。这个标准本身，就是答案。^[11]

以上就是今天 AI 信号站的全部内容。我们明天见。

参考链接

[1] : https://seed.bytedance.com/zh/blog/seed2-1-%E6%AD%A3%E5%BC%8F%E5%8F%91%E5%B8%83-%E6%B7%B1%E5%85%A5-ai-%E7%94%9F%E4%BA%A7%E5%8A%9B

[2] : https://www.ithome.com/0/967/636.htm

[3] : https://mp.weixin.qq.com/s/IY6XGp4k6VgD9ZPH6YprCA

[4] : https://x.com/berryxia/status/2069090959938466298

[5] : https://huggingface.co/blog/ibm-research/cuga-apps

[6] : https://oak.space/oak/oak

[7] : https://huggingface.co/blog/huggingface-hub-release-ci

[8] : https://www.ithome.com/0/967/234.htm

[9] : https://www.artificialintelligence-news.com/news/five-eyes-warning-ai-cyber-threats

[10] : https://techcrunch.com/2026/06/22/google-deepmind-bets-75m-on-ais-future-in-hollywood-with-a24-deal

[11] : https://developers.googleblog.com/measuring-what-matters-with-jules

本文由 AI 辅助创作，作者进行了实测验证和编辑修改。

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

小米在纽北刷了自动驾驶纪录,五眼联盟说 AI 学会了写钓鱼邮件

新来的大模型

能玩的新东西

最好用的工具

圈里出什么事了

技术新突破

最新文章

热门文章

随机文章

小米在纽北刷了自动驾驶纪录,五眼联盟说 AI 学会了写钓鱼邮件

新来的大模型

能玩的新东西

最好用的工具

圈里出什么事了

技术新突破

兰德酷路泽不是给所有人的SUV,别把信仰买成通勤负担

红旗LS7不是给多数人的国产SUV天花板,先想清楚你的地库和日子

最新文章

热门文章

随机文章