DeepSeek站在伟人肩上,这个伟人究竟是什么?
发布时间:2025-02-05 09:01
春节时期,中国国产年夜模子DeepSeek连续激发热议,不测地成为假期最热点的科技话题。1月20日,中国年夜模子公司深度求索正式宣布推理年夜模子DeepSeek-R1,一经推出就震动了业界。1月27日,DeepSeek利用登顶苹果中国区跟美国区利用市肆收费App下载排行榜。1月31日,英伟达、亚马逊跟微软这三家美国科技巨子,在统一天发布接入DeepSeek-R1。DeepSeek的胜利,是AI的一次破圈。这一次DeepSeek激发的探讨特殊热闹,一方面是由于它到达了国际进步程度;另一方面,是由于它的可用水平、实现度超越了必定的程度,再加上热闹的探讨,惹起了良多一般人的留神,也进入了他们的生涯跟任务之中。DeepSeek表现了国产年夜模子的才能,乃至有可能追逐、反超天下进步程度。与此同时,DeepSeek年夜幅下降了AI模子的练习本钱,其R1模子的练习本钱仅为557.6万美元。比拟之下,OpenAI的GPT模子练习本钱高达1亿美元。良多人对DeepSeek年夜模子表白了高度赞美。面临如潮好评,深度求索(DeepSeek)开创人梁文锋谦逊地回应:“咱们不外是站在开源社区伟人们的肩膀上,给国产年夜模子这栋年夜厦多拧了多少颗螺丝。”梁文锋所说的这个“伟人”——开源社区(Open Source),全称为开放源代码,就是让用户应用源代码,在其基本上修正跟进修。开源,有天下年夜同的美妙欲望,但无须讳言也有好处念头。开源战略能够吸引寰球开辟者跟研讨者的存眷,构成一个强盛的技巧社区。这个技巧社区存在迅速性与合作上风,能构成“技巧共享-生态繁华-反哺翻新”的正轮回。正由于开源有这个上风,在竞争中处于弱势的一方就可能抉择开源的方法,去改变本人的竞争弱势。盘算机行业的竞争,每每都是一个关闭的生态,对应着一个开放的、开源的生态。开源现在曾经是AI迅猛开展的助推剂。Meta首席人工智能迷信家、2018年图灵奖得主杨破昆评估DeepSeek时就说:“与其说是中国在人工智能上超出美国,准确的见解应当是开源代码正在超出私有形式。DeepSeek从开放研讨跟开放源码中受益(比方来自Meta的PyTorch跟LLaMA)。”现实上,AI年夜模子开源,最主要的推进力之一恰是Meta。Meta开源的名目,从年夜模子LLaMA到图像宰割模子Segment-Anything,笼罩了种种模态、种种场景。Meta的LLaMA是最强盛的开源年夜模子之一。2023年7月,Meta宣布的LLaMA2,开源协定从“仅研讨可用”转向“收费可商用”,虽培养了一大量“套壳年夜模子”,但也辅助Meta转变了年夜模子竞争OpenAl独有鳌头的格式。这傍边,最强盛的恰是DeepSeek。DeepSeek验证开源模子可濒临闭源机能,又会反过去使得Meta等巨子加码开源AI。近来,Meta又开源了多个AI名目,包含图像宰割模子SAM 2.1、多模态言语模子Spirit LM、自学评价器跟改良的跨言语句子编码器Mexma等,晋升了AI在图像处置跟语音辨认范畴的才能。固然开源增进了AI的迅猛开展,但应当看到的是,开源的实质是用开放促效力,而在当当代界,效力在良多时间曾经不再是第一位的斟酌。AI技巧是由软硬两方面形成的,在硬件逐步走向关闭的同时,一个可能的隐忧则是,软件的开源能否也会走向关闭。这就请求中国AI界提前做好应答之策,用翻新、开放去回应关闭,正如DeepSeek也开源了本人的年夜模子。 □ 刘远举前往搜狐,检查更多 平台申明:该文观念仅代表作者自己,搜狐号系信息宣布平台,搜狐仅供给信息存储空间效劳。
购买咨询电话
400-123-4567