华盛顿特区
—
华盛顿特区——展望2025年,我们看到这一年并未以烟花或一场数百万观众实时观看的盛大的演讲告终。
真正改变一切的事物悄然浮现。这些变革通过数据中心、季度报告和技术论文显现出来,改变了整个行业对机器实际能力的认知方式。
到了十二月,所有行业都已悄然围绕着十二个月前还像科幻小说般天马行空的构想完成了自我重塑。
以下是今年真正带来变革的五大要素:
英伟达与OpenAI达成1000亿美元里程碑式协议
这一消息并非在烟雾缭绕的舞台上宣布。
在九月的某个周二,双方发布了一份简短的联合声明:英伟达将向OpenAI提供价值高达1000亿美元的H100、H200、Blackwell GPU,以及运行这些芯片所需的数据中心空间和电力。
从2026年起,OpenAI将获得约10吉瓦的计算能力保障(相当于新西兰的年能源预算)。
该协议将加速通往超级智能的道路,通过更快速、更可扩展的人工智能发展造福人类。
OpenAI发布了其首个思考型模型o3
OpenAI于四月发布了名为o3的新模型。
最大区别何在?o3不会立即给出脑海中浮现的第一个答案。它会停顿片刻,绘制计划草图,在后台进行小规模测试计算,并自我复核。延迟有时仅两秒,有时则长达三分钟。
但问题在于,每个经过思考的答案消耗的能量是旧式“即发即忘”模型的10到20倍。
o3不仅在编程、数学和科学领域表现卓越,还整合了基于代理的工具使用功能,能够以更低的成本高效解决多步骤问题。
Gemini 3,正在彻底改变图像、视频和文本处理的人工智能领域
十一月已至,谷歌正式发布了Gemini 3。
Gemini 3能够同时处理文本、图像、视频、音频及三维点云数据,其生成的答案令传统人工智能专家模型相形见绌。
Gemini 3融合了能够处理文本、视频、音频和代码的自然多模态能力与尖端推理技术,在各个领域都达到了卓越水平。
技术观察家指出,Gemini 3具备博士级别的解决问题能力,并拥有能够自主生成交互式解决方案的基于代理的工具。
中国的DeepSeek V3实现技术平起平坐
今年五月,一支鲜为人知的团队DeepSeek发布了DeepSeek V3的全部数值参数。
DeepSeek V3不仅与西方封闭边界模型平分秋色,更在众多推理和编码任务中遥遥领先,且能耗远低于后者。
圣保罗、班加罗尔和拉各斯的开发者团队在数周内完成了葡萄牙语、印地语、约鲁巴语和斯瓦希里语的精细调优。这些语言在大型实验室中仍处于次要地位。
DeepSeek V3在数学、编码和逻辑领域表现出色,与GPT-40等昂贵的封闭模型不相上下,但由于它是完全开源的,任何人都可以免费修改该应用程序。
DeepSeek V3仅需560万美元的人工智能训练成本(远低于主要竞争对手的投入),使超级智能AI得以在不突破预算的情况下,为创业者、开发者及普通用户所用。
自主代理正融入日常工作流程
当秋天来临时,自主代理的热潮终于成熟。
这些代理并非带有待办事项清单的聊天机器人;它们能够打开客户关系管理(CRM)系统,读取最新发货单,察觉集装箱延误,向供应商发送邮件,更新企业资源规划 (ERP)系统,并在可能延误触发罚款条款时提醒财务部门的小程序。
但向它们的过渡并非一帆风顺。它们在复杂任务中仍会出错,每个大型应用程序仍需人工干预。
综合来看,2025年并未成为未来不再征求我们许可的年份。
技术不仅逐步完善,更从“令人印象深刻的演示”演变为“人们做事时默认使用的AI”。
人工智能早已融入我们的生活,目前已掌控着全球半数最重要的业务流程。
2026年唯一悬而未决的问题是:谁将主导这些应用?而我们其他人是否会认同人工智能的发展方向?











