对话杜克年夜学教学陈怡然:从“1到100”也很难
发布时间:2025-02-15 09:02
美国杜克年夜学电子与盘算机工程系出色教学 陈怡然划重点:1.“从0到1”难,“从1到100”实在也一样难。说DeepSeek只是工程上的技巧拼接,并不公正。2.DeepSeek素来没想过“弯道超车”。它的主意很简略,就是在保障年夜模子机能的条件下,把昂扬的练习本钱打上去。3.良多呆板进修做得好的都是年青人。4.中国人才良多,但假如用KPI给研讨职员“拴逝世”在那,“带着脚镣舞蹈”,他必定跳得欠好。出品|搜狐科技作者|郑松毅编纂|杨锦所谓“人红长短多”,国产AI“黑马”DeepSeek,在震动国内外科技圈后,正在激发争媾和质疑。跟着市场逐步安静上去,业界质疑DeepSeek技巧翻新性的声响一直袭来,以及中美之间的AI差距能否真的在缩小找齐。DeepSeek被捧得太甚了吗?马斯克、奥特曼等对其练习发生的质疑,该作何说明?中美在AI竞技打法上有哪些新思考,差距多少何?克日,搜狐科技与有着近20年学术积聚,身处AI海潮一线的,美国杜克年夜学电子与盘算机工程系出色教学陈怡然,停止了深度对话。以下为对话实录(经收拾编纂)搜狐科技:外界对DeepSeek有良多差别的声响。Scale AI开创人以为,“DeepSeek的呈现或将一改美国在从前十多少年的AI当先地位。” 但谷歌DeepMind 首席履行官却直言,“其技巧无实质翻新,是外界炒作过火了。” 你怎样看? 开展全文
陈怡然:DeepSeek是工程上的胜利,它用到的技巧基础不什么是各人从前都不晓得的,或许说是“石破天荒”的。
搜狐科技:该怎样懂得“工程上的胜利”?
陈怡然:现在对年夜模子练习,有良多种方式,固然差别的方式也会组合到一同,实验练习后果。
DeepSeek实在是把这点做到了极致,一直实验差别的方式组合、方式优化,最后能把练习本钱降到当初这么低的程度,而且乐意把找到的好方式开源分享,我感到这其最重要的奉献。
搜狐科技:你更偏向于夸大它在工程上的胜利,是暗指技巧翻新上没做出太多奉献吗?
陈怡然:不克不及这么说,工程上的胜利也是树立在技巧翻新基本之上的。
就算用到的技巧各人都晓得,但怎样无效地组合在一同,酿成一个实在可用的优良架构,现实上是很难的一件事。
各人常说“从0到1”难,但“从1到100”实在也一样难。只以为DeepSeek是工程上的技巧拼接,并不公正。
搜狐科技:各人以为DeepSeek此次用到的“MoE”等亮点技巧,之前早有企业用到,技巧实质并无翻新,没任何迷信提高,你怎样看?
陈怡然:“MoE”是很早之前就有的技巧,咱们团队在研讨中也用过,这都不是机密。但不克不及说,有人当初用更好的方法去从新用一遍就不是翻新。
尤其当初良多技巧都是开源的,很难说谁能找到一本各人从未见过的“武林秘笈”,年夜多技巧都是有迹可循的,这也是科研进程中的畸形轨迹。
搜狐科技:对DeepSeek提出质疑的另有马斯克,不信任他们只有少少的芯片,也不信任官方表露的只用了600万美元练习本钱。你怎样看?
陈怡然:团体研发本钱确定是高于600万美元的,这个毫无疑难。由于想把模子做成当初如许,确定是经由了有数次试错的。
就像做菜,你之前试菜用了几多食材,几多本钱并不明白。600万美元指的是最后一次把菜炒胜利,用了这么多钱。
搜狐科技:有人以为DeepSeek的团队团体很年青,DeepSeek的当先上风也很快可能被其余人超出。你感到呢?
陈怡然:前面有团队会做出超出DeepSeek的模子是确定的,并且不会太久。当初相干技巧曾经开源,良多人曾经上手研讨这个事,做出来不奇异。
但从年纪角度讲,呆板进修做的好的人都很年青。比方何恺明那群人,良多有影响力的主意都是他们在二十多岁时就提出来的。
搜狐科技:回到对技巧的探讨,奥特曼说“DeepSeek用低本钱练习年夜模子只是小打小闹,要想做最智能的模子,就须要持续在资金跟算力上投入。”提醒了OpenAI与DeepSeek在技巧道路上的不合。你怎样看中美在AI竞技打法上的博弈?
陈怡然:我感到良多人对DeepSeek有一个很深的曲解,DeepSeek素来没想过“弯道超车”。他的主意很简略,就是要找到一个方式,在保障年夜模子机能的条件下,把昂扬的练习本钱打上去。
团体而言,DeepSeek跟OpenAI走的不是一条路。OpenAI依然信任用Scaling Law “鼎力出奇观”,目的是造出新模子处理以后模子处理不了的成绩。而DeepSeek现实是在已有框架下,探寻处理成绩的更好方式,比方造出同样机能模子的条件下,怎样做得更廉价。
搜狐科技:硅谷始终推重“烧钱形式”,堆资金跟算力练习年夜模子。DeepSeek的出圈有转变硅谷的风向吗?
陈怡然:我实在不感到。正确来说,在找到极简的无效模子表白前,平日会先应用一个比拟庞杂带有冗余的模子来实现想要表白的事,就像OpenAI最早颁布的模子,再由繁化简。
为了探索AI的下一阶段程度,这个事确定仍是要有人来做的。且新技巧探寻的开端阶段,确定仍是偏向于用更年夜的模子跟数据停止练习,硅谷依然在做这件事。
搜狐科技:以是像OpenAI这类玩家,更像技巧“开辟者”,冲在最后面。像DeepSeek这类玩家,更像是工程师,来优化现有处理计划?
陈怡然:能够这么懂得,但不克不及说工程师似乎不开辟者主要。由于开辟每每象征着要耗费大批资本本钱,要想让技巧真正做到普惠,让民众年夜范围应用,还要靠工程师多下工夫。
以是完整不像各人想的有一个什么高低之分,无论是开辟仍是优化,都须要有人去做。
搜狐科技:聊一个比拟轻松的话题,为什么感到这一波东方的反映比海内更夸大?
陈怡然:我感到中美都挺上头的。从海内来讲,盼望让各人都看到中国呈现了一个特殊好的技巧,尤其是在练习效力跟开源方面,长短常骄傲的一件事。
从美国来讲,有一局部是对之前战略的反思,复盘之前AI技巧战略的对与错,并计划下一步须要更多投入的是什么。再有就是华尔街的操纵,要去炒作散布这些事,从而影响美股来挣钱。
我感到各人仍是要坚持一个绝对客不雅沉着的脑筋去看这个事,尤其是做技巧的人。
搜狐科技:美国、日本、印度等国度法案发起,要限度DeepSeek的下载应用,最高处分面对开释。这又是一次技巧制裁吗,你怎样看?
陈怡然:不消除这种可能性,但也有逻辑在外面。一方面是出于保险的斟酌,另一方面是DeepSeek火的太忽然,可能连这个团队都没想到能到明天这个田地,像数据合规等操纵可能并没来得及做完,其余国度在考核的时间资料不全。
搜狐科技:总的来看,你感到DeepSeek的出圈,预示着中美AI差距在缩小吗?
陈怡然:我感到这实在是一个伪命题。从技巧角度来说,独一的差距可能就是谁先一步做出来了,但这又不是其余团队真正的落伍。由于其余人可能在模子基本上加以改良,过段时光又做出了更好的作品。永久是如许瓜代的,很难有人永久当先。
将来就是看谁可能在贸易形式上,或许在一直的技巧翻新上能连续的往下走。
至于算力跟芯片,是别的一个成绩。中国的算力确定仍是远小于美国的,但不至于说就把海内的研发进度锁逝世了。国产芯片也正在尽力做AI练习的适配任务,而且年夜模子练习所需的本钱前面必定会持续周期性降落。
搜狐科技:你怎样看AGI(通用人工智能),当初又近了一点吗?
陈怡然:假如你看过一些采访,比方李飞飞,她感到念叨AGI不任何意思,这是一个Moving Target(永久在变化的目的)。
什么是AGI?每团体都有差别的懂得。之前说是经由过程图灵测试就能够,当初又要用更高阶的测试来磨练。我感到各人对这个不必太上心。
搜狐科技:前两天看你在微博上又提起了“AI人才”话题,你感到以后中国的AI人才贮备怎样样?
陈怡然:中国人才良多,这是确定的。那假如说是一个开放的情况,一个开放的心态,一个宽松的研发场合,信任这些人才干做得更好。
我感到科研就是如许的,假如你用一个KPI给研讨职员“拴逝世”在那,“带着脚镣舞蹈”,他必定跳得欠好。相反,当让他去自在施展的时间,反而会带来更多惊喜。
搜狐科技:最后一个成绩,你以为DeepSeek的暴发,给中国AI年夜模子开展带来了什么启示?百度、腾讯、阿里、“AI六小龙”,能够在哪些方面多下工夫,多些思考?
陈怡然:这是一个特殊好的成绩。我团体断定,会让良多年夜厂更存眷于模子的效力,而不是一味地寻求模子的年夜跟高机能。
良多模子能够说曾经超越人类智能程度,但可能受运转效力影响,让用户难以决定用不必。实在对一般用户来说,模子的正确率是71.9%仍是72%并没那么主要。
反不雅练习跟应用本钱,假如一降落了10倍,这可能是一个宏大的影响。我感到各人会对这种现实的本钱成绩愈加敏感,这也会在必定水平上影响模子的放开利用。
就是各人别老想着说做一个像“天网”似的supercomputer(超等盘算机),现实上咱们须要的是千万万万个跟人类一样聪慧的AI在身边,履行差别的义务,各有千秋。前往搜狐,检查更多