在2026年台北GTC大会上,英伟达正式发布了Cosmos 3——全球首款完全开放的全模态物理AI模型。如果说ChatGPT让AI学会了聊天,Sora让AI学会了”想象画面”,那么Cosmos 3正在让AI学会理解真实世界的物理规律。
全模态意味着什么?Cosmos 3可以同时处理文本、图像、视频、音频和传感器数据,并在此基础上构建对物理世界的深度理解。它不仅”看懂”一段视频里发生了什么,还能预测后续的物理变化——杯子从桌上滑落会如何碎裂、车辆在湿滑路面刹车距离会增加多少。这种能力对于自动驾驶、机器人操作和工业仿真等领域至关重要。
黄仁勋宣布Cosmos 3将完全开源,延续了英伟达在AI基础设施层面的开放策略。对于全球开发者来说,这等于获得了一个强大的物理世界模拟器,可以在此基础上构建各种应用场景,而不必从零搭建。
从语言模型到视觉模型,再到物理世界模型,AI的进化路径越来越清晰:它正在从”书斋里的天才”变成”能动手的实干家”。Cosmos 3或许只是通往通用人工智能的一小步,但这一小步的意义在于——AI终于开始理解我们生活的这个世界,是如何运转的。
未来已来,只是尚未均匀分布。