J9九游会中国★◈✿ღ,j9九游会官方网站J9九游会★◈✿ღ!j9游会真人游戏第一品牌★◈✿ღ。J9九游会 - 真人游戏第一品牌★◈✿ღ,【新智元导读】一场公开演讲★◈✿ღ,LeCun毫不留情揭穿真相★◈✿ღ:所谓的机器人行业★◈✿ღ,离真正的智能还远着呢★◈✿ღ!这番话像一枚深水炸弹★◈✿ღ,瞬间引爆了战火★◈✿ღ,特斯拉★◈✿ღ、Figure高管纷纷在线回怼蜜芽188.mon.★◈✿ღ。
机器人在工厂里拧螺丝★◈✿ღ、搬货等★◈✿ღ,可通过特定任务训练实现★◈✿ღ,但让它们在家中叠衣服★◈✿ღ、倒水★◈✿ღ、理解人的意图★◈✿ღ,还很难★◈✿ღ。
而突破的核心★◈✿ღ,在于打造一款真正可以规划的「世界模型」架构★◈✿ღ,即能够学习理解和预测物理世界系统★◈✿ღ。
谁曾想蜜芽188.mon.J9九游会★◈✿ღ,LeCun这番话再次捅了「马蜂窝」★◈✿ღ,直接给这场狂热泼了一盆冷水★◈✿ღ,引机器人界大佬上阵怒喷J9九游会★◈✿ღ。
Figure创始人Brett Adcock直接喊话★◈✿ღ,「谁去和LeCun说一声★◈✿ღ,让他别端着了★◈✿ღ,亲自下场干点实事吧」★◈✿ღ!
上大学时★◈✿ღ,他有点偶然地发现★◈✿ღ,原来早在50-60年代★◈✿ღ,包括1981年诺奖得主David H. Hubel和Torsten N. Wiesel等人★◈✿ღ,就已经开始思考「自组织」的问题——也就是系统如何自我组织学习★◈✿ღ。
我一直认为★◈✿ღ,生物学给工程提供了很多灵感★◈✿ღ。在自然界中★◈✿ღ,所有活着的东西都有适应能力★◈✿ღ,只要有神经系统就能学习★◈✿ღ。
所以★◈✿ღ,我当时想★◈✿ღ,也许我们人类没那么聪明★◈✿ღ,构建智能系统最靠谱的方法★◈✿ღ,可能是让它自己学会变聪明★◈✿ღ。
人工智能领域在1990至2000年代经历「寒冬」★◈✿ღ,但2013年LeCun加入Facebook★◈✿ღ,创立FAIR(Facebook AI Research)★◈✿ღ,并推动「深度学习」这一术语取代「神经网络」J9九游会★◈✿ღ,标志着产业界开始系统性地接受这一范式★◈✿ღ。
2018年★◈✿ღ,因在概念与工程领域的突破性贡献★◈✿ღ,他让深度神经网络成为计算技术的关键组成部分★◈✿ღ,和Bengio★◈✿ღ、Hinton共享图灵奖★◈✿ღ。
他指出★◈✿ღ,文本属于「低带宽」数据源★◈✿ღ,「仅靠文本训练永远无法实现人类水平智能」★◈✿ღ。真正的智能来源于高带宽的感知输入——视觉蜜芽188.mon.★◈✿ღ、听觉★◈✿ღ、触觉等多模态经验蜜芽188.mon.★◈✿ღ,而非低维度的离散符号★◈✿ღ。
他进一步指出J9九游会★◈✿ღ,LLM有时虽能提供实用的结果★◈✿ღ,甚至让人误以为其「智商堪比博士」★◈✿ღ,但这些系统只是「回忆」训练中的信息★◈✿ღ。
LeCun指出蜜芽188.mon.★◈✿ღ,大语言模型(LLM)存在本质瓶颈——虽然形式上通过「学习」取代了显式编码J9九游会★◈✿ღ,但仍依赖人类知识的间接转移★◈✿ღ。
他强调★◈✿ღ,即便猫的大脑仅含约2.8亿个神经元蜜芽188.mon.★◈✿ღ,其对物理世界的理解与行动规划能力仍远超当前AI系统★◈✿ღ。
猫能感知三维空间★◈✿ღ、判断物体稳定性★◈✿ღ、规划复杂动作★◈✿ღ,而目前的所有生成式模型恰恰无法企及这些能力★◈✿ღ。
就好比★◈✿ღ,让一个机器人冲一杯咖啡★◈✿ღ,它需要想象一系列动作——拿起杯子★◈✿ღ、倒水★◈✿ღ、搅拌★◈✿ღ,并预测每一步的结果★◈✿ღ。
同时蜜芽188.mon.★◈✿ღ,系统可结合一个「代价函数」(cost function)★◈✿ღ,用于评估特定任务的完成情况★◈✿ღ。
在此基础上★◈✿ღ,可运用优化方法★◈✿ღ,搜索能够优化任务目标的最优动作序列★◈✿ღ,这一过程即为「规划与最优控制」★◈✿ღ。
实验已证明★◈✿ღ,可以用世界状态的表示——来自现有模型DINO★◈✿ღ,无论是从零开始学习★◈✿ღ,还是基于V-JEPA 2等框架★◈✿ღ,都可以做到这一点★◈✿ღ。
机器人不用针对特定任务反复训练★◈✿ღ,只需从模拟数据或真实操作中学习「动作-结果」的关系★◈✿ღ,就能零样本完成新任务★◈✿ღ。
主持人一听★◈✿ღ,马上话锋一转打了个圆场★◈✿ღ,「没关系★◈✿ღ,我们不担心那些公司★◈✿ღ。而且说真的★◈✿ღ,我们非常信奉创业精神」★◈✿ღ。
他将Figure的技术路径与同行对比★◈✿ღ,直言某些公开演示只是「戏剧表演」或预设程序★◈✿ღ。相反★◈✿ღ,Figure机器人的所有操作都「由神经网络驱动」★◈✿ღ。
耐人寻味的是★◈✿ღ,在一个关键问题上的判断与Yann LeCun不谋而合★◈✿ღ:他也否认制造业是主要突破方向★◈✿ღ,并指出「人形机器人当前的竞争焦点在于谁能攻克通用机器人技术」★◈✿ღ。
据报道★◈✿ღ,特斯拉正在建设年产百万台Optimus机器人的生产线年初推出具备「量产意向」的V3原型机★◈✿ღ。
在最近的计算机视觉顶会ICCV★◈✿ღ,特斯拉AI负责人Ashok Elluswamy详细介绍了公司的「神经世界模拟器」——一个通过车队视频数据训练的端到端系统★◈✿ღ。
不同于传统模型根据状态预测动作★◈✿ღ,神经世界模拟器能够基于当前状态与后续动作★◈✿ღ,直接合成未来状态★◈✿ღ。
Elluswamy确认★◈✿ღ,这套被视作世界模型问题直接解决方案的架构★◈✿ღ,将「无缝迁移」至Optimus机器人★◈✿ღ。
Yann LeCun的论断看似否定了整个人形机器人领域★◈✿ღ,但已有企业公开将其研发方向与他倡导的「世界模型」概念对齐★◈✿ღ。
如图所示★◈✿ღ,1X世界模型包含视觉编码器★◈✿ღ、动作编码器J9九游会★◈✿ღ、核心网络★◈✿ღ,以及视频与状态价值解码器★◈✿ღ。通过对成功标签进行监督学习生成的状态价值预测★◈✿ღ,可对输入动作的质量进行量化评估★◈✿ღ。
首席执行官Bernt Børnich在播客中坦言★◈✿ღ,让机器人进入家庭存在「理想与现实的落差」J9九游会★◈✿ღ,指出「现实环境复杂得离谱」★◈✿ღ,甚至「Wi-Fi连接问题比机器人技术本身更棘手」★◈✿ღ。
这种务实立场★◈✿ღ,结合其轻量级肌腱驱动设计所带来的安全性优势蜜芽188.mon.★◈✿ღ,暗示着行业清醒认识到★◈✿ღ:Yann LeCun所说的「突破性进展」仍需要持续探索★◈✿ღ。
Yann LeCun的警告★◈✿ღ,最终重新定义了人形机器人竞赛的维度★◈✿ღ:胜利者★◈✿ღ,或许不属于推出最炫酷demo或设定最激进量产目标的厂商★◈✿ღ,而将属于那个率先攻克机器理解物理世界这一根本性难题的探索者★◈✿ღ。
搞笑的是★◈✿ღ,主持人前一句还在夸「Llama的诞生让世界AI民主化」★◈✿ღ,话音还没落★◈✿ღ,LeCun就在旁边急着插话——
接着★◈✿ღ,他分享了幕后故事★◈✿ღ,「第一代Llama★◈✿ღ,其实有一点像『海盗』项目(pirate project)★◈✿ღ,与官方LLM并行开发」★◈✿ღ。
最后★◈✿ღ,在2023年初★◈✿ღ,小扎下定决心组建了一个GenAI团队★◈✿ღ,也就如今的「超级智能实验室」(MSL)的前身★◈✿ღ,主要就是为了把它产品化★◈✿ღ。
现场★◈✿ღ,主持人再次圆话★◈✿ღ,「但最后能跑出来的★◈✿ღ,往往还是『臭鼬工厂』(Skunk Works)这种模式」★◈✿ღ。

京公网安备 11010502046000号