本周 AI 圈猛料不断:吴恩达谈 AI 工作流重构;OpenAI 为了盈利终于在 ChatGPT 里塞广告了;英伟达发布 Alpamayo-R1,让自动驾驶学会“思考”;苹果放弃自研大模型基座,转而向谷歌“交保护费”使用 Gemini。
吴恩达:AI 转型需要重构工作流
“自下而上的创新固然重要,但要实现变革性影响,往往需要自上而下的战略方向,重新设计端到端的工作流。”
吴恩达在达沃斯世界经济论坛(WEF)上发回观察:许多企业进行了大量自下而上的 AI 实验(“百花齐放”),但未能带来显著回报。真正的巨大收益来自于工作流重构(Workflow Redesign)。
以银行贷款为例:
- 渐进式优化:用 AI 替代人工进行“初步审批”,将时间从 1 小时缩短到 10 分钟。这只是效率的提升。
- 变革性重构:重新设计整个产品,提供“10 分钟极速放款”服务。这需要改变市场营销、数字化申请流程以及后端的终审机制。虽然 AI 可能只用于“初步审批”这一步,但它触发了整个链条的重塑,从而极大地提升了产品竞争力。
此外,WEF 的技术热点还包括:智能体 AI (Agentic AI)、主权 AI (Sovereign AI) 以及数据中心基础设施瓶颈。
ChatGPT 引入广告:旧时代的变现方式
AI 找到了新的收入来源,但它看起来很像旧时代的网页横幅广告。
- 发生了什么:OpenAI 开始在美国测试在 ChatGPT 免费版中显示广告。
- 形式:相关的广告会出现在对话底部,包含简短信息、图片和链接。它们不会影响 AI 的回答内容。
- 隐私:广告不会出现在健康、政治等敏感话题附近,且对话内容不会共享给广告商。
- 背景:OpenAI 预计 2025 年收入将达 200 亿美元,但成本可能超过 90 亿美元。广告、订阅和电商(Shopping)构成了其不断演进的收入战略。
这意味着,为了维持昂贵的算力开销,OpenAI 正在尝试一切可能的变现手段。如果测试成功,付费用户将(暂时)享受无广告体验,而免费用户将成为广告受众。
英伟达 Alpamayo-R1:会思考的自动驾驶
思维链(Chain-of-Thought) 不仅能做数学题,还能帮自动驾驶汽车决定下一步该怎么走。
- 新模型:英伟达发布了 Alpamayo-R1,这是一个用于自动驾驶的视觉-语言-动作模型。
- 核心创新:它不仅输出驾驶轨迹,还会输出推理文本(Reasoning Text)。它被训练成在行动前先“思考”,并确保行动与推理一致。
- 效果:在模拟测试中,具备推理能力的模型将与车辆的“近距离接触”(险情)发生率从 17% 降低到了 11%。
- 意义:这让自动驾驶系统更具可解释性。如果出现问题,工程师可以查看系统的推理过程,了解它为什么做出某个决定(例如:“检测到前方有行人,准备停车”)。
苹果大模型基座将采用 Gemini
苹果与谷歌达成了一项多年期协议,将使用 Gemini 模型作为苹果设备 AI 功能的基础。
- 交易详情:据报道,苹果每年将支付 10 亿美元(甚至更多,视云服务合同而定),获得 Gemini 模型的访问权和微调权。
- Siri 的进化
- iOS 26.4:Siri 将具备分析屏幕内容的能力(基于 Apple Foundation Models V10,即修改版的 Gemini)。
- iOS 27:Siri 将演变为全能的语音+文本聊天机器人,能执行跨应用的多步操作(基于 V11)。
- 战略撤退:这标志着苹果放弃了构建专有 AI 基础设施的昂贵竞赛。苹果曾尝试自研“Apple GPT”,但因未达标而推迟。
- 多模型策略:除了 Gemini,苹果还集成了 ChatGPT,并保留了未来引入 Anthropic 等其他模型的可能性。苹果通过在巨头之间周旋,以相对低廉的价格获得了最顶尖的模型能力。
FlashWorld:秒级生成高质量 3D 场景
现有的“文生 3D”要么太慢,要么效果不一致。厦门大学、腾讯和复旦大学的研究人员推出了 FlashWorld。
- 速度:在单张 Nvidia H20 GPU 上仅需 9 秒即可生成 3D 场景。相比之下,之前的 SOTA 方法可能需要几分钟甚至一小时。
- 原理:结合了 2D 生成的丰富细节和 3D 生成的一致性,利用预训练的视频扩散模型作为“老师”来指导生成。
- 应用:这意味着 3D 内容创作可能从“预渲染”转向“实时生成”,将极大改变游戏和 VR 体验。
笔者锐评 💡
本周最令人玩味的新闻莫过于 苹果与谷歌的联手。
这看似是苹果在 AI 时代的“掉队”和“妥协”,实则是库克式实用主义的巅峰。苹果极其聪明地算了一笔账:与其每年烧几百亿美元去卷那个看不见底的“基础模型军备竞赛”,不如花 10 亿美元“交个朋友”,直接把地表最强的模型拿来用。
这一招不仅瞬间补齐了 Siri 的智商短板,还让苹果从“苦哈哈的基建建设者”变成了“坐收过路费的平台方”。更讽刺的是,苹果最大的手机竞争对手(谷歌)现在成了它最重要的 AI 供应商。
这也给所有非头部科技公司提了个醒:并不是每家公司都需要拥有自己的 Foundation Model。在 AI 产业链中,找准自己的生态位(哪怕是做应用层、做终端入口),可能比硬磕底层技术活得更滋润。
另外,OpenAI 引入广告也标志着 AI 行业的一个转折点:烧钱换增长的时代结束了,流量变现的镰刀磨快了。好好享受现在的清爽界面吧,未来的 AI 对话框,可能就像现在的搜索引擎一样热闹了。
求点赞 👍 求关注 ❤️ 求收藏 ⭐️你的支持是我更新的最大动力!