对话杜克年夜学教学陈怡然：从“1到100”也很难_bifa·必发官方网站

400-123-4567

对话杜克年夜学教学陈怡然：从“1到100”也很难

发布时间：2025-02-15 09:02

美国杜克年夜学电子与盘算机工程系出色教学陈怡然划重点：1.“从0到1”难，“从1到100”实在也一样难。说DeepSeek只是工程上的技巧拼接，并不公正。2.DeepSeek素来没想过“弯道超车”。它的主意很简略，就是在保障年夜模子机能的条件下，把昂扬的练习本钱打上去。3.良多呆板进修做得好的都是年青人。4.中国人才良多，但假如用KPI给研讨职员“拴逝世”在那，“带着脚镣舞蹈”，他必定跳得欠好。出品｜搜狐科技作者｜郑松毅编纂｜杨锦所谓“人红长短多”，国产AI“黑马”DeepSeek，在震动国内外科技圈后，正在激发争媾和质疑。跟着市场逐步安静上去，业界质疑DeepSeek技巧翻新性的声响一直袭来，以及中美之间的AI差距能否真的在缩小找齐。DeepSeek被捧得太甚了吗？马斯克、奥特曼等对其练习发生的质疑，该作何说明？中美在AI竞技打法上有哪些新思考，差距多少何？克日，搜狐科技与有着近20年学术积聚，身处AI海潮一线的，美国杜克年夜学电子与盘算机工程系出色教学陈怡然，停止了深度对话。以下为对话实录（经收拾编纂）搜狐科技：外界对DeepSeek有良多差别的声响。Scale AI开创人以为，“DeepSeek的呈现或将一改美国在从前十多少年的AI当先地位。” 但谷歌DeepMind 首席履行官却直言，“其技巧无实质翻新，是外界炒作过火了。” 你怎样看？开展全文陈怡然：DeepSeek是工程上的胜利，它用到的技巧基础不什么是各人从前都不晓得的，或许说是“石破天荒”的。搜狐科技：该怎样懂得“工程上的胜利”？陈怡然：现在对年夜模子练习，有良多种方式，固然差别的方式也会组合到一同，实验练习后果。 DeepSeek实在是把这点做到了极致，一直实验差别的方式组合、方式优化，最后能把练习本钱降到当初这么低的程度，而且乐意把找到的好方式开源分享，我感到这其最重要的奉献。搜狐科技：你更偏向于夸大它在工程上的胜利，是暗指技巧翻新上没做出太多奉献吗？陈怡然：不克不及这么说，工程上的胜利也是树立在技巧翻新基本之上的。就算用到的技巧各人都晓得，但怎样无效地组合在一同，酿成一个实在可用的优良架构，现实上是很难的一件事。各人常说“从0到1”难，但“从1到100”实在也一样难。只以为DeepSeek是工程上的技巧拼接，并不公正。搜狐科技：各人以为DeepSeek此次用到的“MoE”等亮点技巧，之前早有企业用到，技巧实质并无翻新，没任何迷信提高，你怎样看？陈怡然：“MoE”是很早之前就有的技巧，咱们团队在研讨中也用过，这都不是机密。但不克不及说，有人当初用更好的方法去从新用一遍就不是翻新。尤其当初良多技巧都是开源的，很难说谁能找到一本各人从未见过的“武林秘笈”，年夜多技巧都是有迹可循的，这也是科研进程中的畸形轨迹。搜狐科技：对DeepSeek提出质疑的另有马斯克，不信任他们只有少少的芯片，也不信任官方表露的只用了600万美元练习本钱。你怎样看？陈怡然：团体研发本钱确定是高于600万美元的，这个毫无疑难。由于想把模子做成当初如许，确定是经由了有数次试错的。就像做菜，你之前试菜用了几多食材，几多本钱并不明白。600万美元指的是最后一次把菜炒胜利，用了这么多钱。搜狐科技：有人以为DeepSeek的团队团体很年青，DeepSeek的当先上风也很快可能被其余人超出。你感到呢？陈怡然：前面有团队会做出超出DeepSeek的模子是确定的，并且不会太久。当初相干技巧曾经开源，良多人曾经上手研讨这个事，做出来不奇异。但从年纪角度讲，呆板进修做的好的人都很年青。比方何恺明那群人，良多有影响力的主意都是他们在二十多岁时就提出来的。搜狐科技：回到对技巧的探讨，奥特曼说“DeepSeek用低本钱练习年夜模子只是小打小闹，要想做最智能的模子，就须要持续在资金跟算力上投入。”提醒了OpenAI与DeepSeek在技巧道路上的不合。你怎样看中美在AI竞技打法上的博弈？陈怡然：我感到良多人对DeepSeek有一个很深的曲解，DeepSeek素来没想过“弯道超车”。他的主意很简略，就是要找到一个方式，在保障年夜模子机能的条件下，把昂扬的练习本钱打上去。团体而言，DeepSeek跟OpenAI走的不是一条路。OpenAI依然信任用Scaling Law “鼎力出奇观”，目的是造出新模子处理以后模子处理不了的成绩。而DeepSeek现实是在已有框架下，探寻处理成绩的更好方式，比方造出同样机能模子的条件下，怎样做得更廉价。搜狐科技：硅谷始终推重“烧钱形式”，堆资金跟算力练习年夜模子。DeepSeek的出圈有转变硅谷的风向吗？陈怡然：我实在不感到。正确来说，在找到极简的无效模子表白前，平日会先应用一个比拟庞杂带有冗余的模子来实现想要表白的事，就像OpenAI最早颁布的模子，再由繁化简。为了探索AI的下一阶段程度，这个事确定仍是要有人来做的。且新技巧探寻的开端阶段，确定仍是偏向于用更年夜的模子跟数据停止练习，硅谷依然在做这件事。搜狐科技：以是像OpenAI这类玩家，更像技巧“开辟者”，冲在最后面。像DeepSeek这类玩家，更像是工程师，来优化现有处理计划？陈怡然：能够这么懂得，但不克不及说工程师似乎不开辟者主要。由于开辟每每象征着要耗费大批资本本钱，要想让技巧真正做到普惠，让民众年夜范围应用，还要靠工程师多下工夫。以是完整不像各人想的有一个什么高低之分，无论是开辟仍是优化，都须要有人去做。搜狐科技：聊一个比拟轻松的话题，为什么感到这一波东方的反映比海内更夸大？陈怡然：我感到中美都挺上头的。从海内来讲，盼望让各人都看到中国呈现了一个特殊好的技巧，尤其是在练习效力跟开源方面，长短常骄傲的一件事。从美国来讲，有一局部是对之前战略的反思，复盘之前AI技巧战略的对与错，并计划下一步须要更多投入的是什么。再有就是华尔街的操纵，要去炒作散布这些事，从而影响美股来挣钱。我感到各人仍是要坚持一个绝对客不雅沉着的脑筋去看这个事，尤其是做技巧的人。搜狐科技：美国、日本、印度等国度法案发起，要限度DeepSeek的下载应用，最高处分面对开释。这又是一次技巧制裁吗，你怎样看？陈怡然：不消除这种可能性，但也有逻辑在外面。一方面是出于保险的斟酌，另一方面是DeepSeek火的太忽然，可能连这个团队都没想到能到明天这个田地，像数据合规等操纵可能并没来得及做完，其余国度在考核的时间资料不全。搜狐科技：总的来看，你感到DeepSeek的出圈，预示着中美AI差距在缩小吗？陈怡然：我感到这实在是一个伪命题。从技巧角度来说，独一的差距可能就是谁先一步做出来了，但这又不是其余团队真正的落伍。由于其余人可能在模子基本上加以改良，过段时光又做出了更好的作品。永久是如许瓜代的，很难有人永久当先。将来就是看谁可能在贸易形式上，或许在一直的技巧翻新上能连续的往下走。至于算力跟芯片，是别的一个成绩。中国的算力确定仍是远小于美国的，但不至于说就把海内的研发进度锁逝世了。国产芯片也正在尽力做AI练习的适配任务，而且年夜模子练习所需的本钱前面必定会持续周期性降落。搜狐科技：你怎样看AGI（通用人工智能），当初又近了一点吗？陈怡然：假如你看过一些采访，比方李飞飞，她感到念叨AGI不任何意思，这是一个Moving Target（永久在变化的目的）。什么是AGI？每团体都有差别的懂得。之前说是经由过程图灵测试就能够，当初又要用更高阶的测试来磨练。我感到各人对这个不必太上心。搜狐科技：前两天看你在微博上又提起了“AI人才”话题，你感到以后中国的AI人才贮备怎样样？陈怡然：中国人才良多，这是确定的。那假如说是一个开放的情况，一个开放的心态，一个宽松的研发场合，信任这些人才干做得更好。我感到科研就是如许的，假如你用一个KPI给研讨职员“拴逝世”在那，“带着脚镣舞蹈”，他必定跳得欠好。相反，当让他去自在施展的时间，反而会带来更多惊喜。搜狐科技：最后一个成绩，你以为DeepSeek的暴发，给中国AI年夜模子开展带来了什么启示？百度、腾讯、阿里、“AI六小龙”，能够在哪些方面多下工夫，多些思考？陈怡然：这是一个特殊好的成绩。我团体断定，会让良多年夜厂更存眷于模子的效力，而不是一味地寻求模子的年夜跟高机能。良多模子能够说曾经超越人类智能程度，但可能受运转效力影响，让用户难以决定用不必。实在对一般用户来说，模子的正确率是71.9%仍是72%并没那么主要。反不雅练习跟应用本钱，假如一降落了10倍，这可能是一个宏大的影响。我感到各人会对这种现实的本钱成绩愈加敏感，这也会在必定水平上影响模子的放开利用。就是各人别老想着说做一个像“天网”似的supercomputer（超等盘算机），现实上咱们须要的是千万万万个跟人类一样聪慧的AI在身边，履行差别的义务，各有千秋。前往搜狐，检查更多

上一篇：半岛叨叨｜DeepSeek赶功课，这操纵老母亲只喊“

下一篇：没有了