百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

拾象李广密:对DeepSeek和智能下半场的几条判断

myzbx 2025-02-15 00:15 42 浏览

·DeepSeek很让人兴奋,但还不能称作范式级创新,更准确的表述是将之前OpenAI o1半遮半掩的范式开源,将整个生态推向很高渗透率,推进整个行业进入了新范式。

DeepSeek 视觉中国 资料图

从2024年第三季度开始我们就一直在讲AI的下半场,虽然OpenAI o1提出了强化学习(RL)叙事,但因为各种原因没有破圈,DeepSeek R1解了RL的谜题,推进整个行业进入了新范式,真正进入智能下半场。

市场上关于DeepSeek是什么、为什么的讨论已经很多了,接下来更有价值讨论是AI竞赛要怎么继续?把过去半个月的思考总结了一下,希望成为探索下半场的路径图,每隔一段时间来复盘。

拾象科技创始人兼CEO李广密。

Insight 01:DeepSeek 超越 OpenAI 了吗?

DeepSeek超越了Meta Llama毫无疑问,但相比OpenAI、Anthropic和Google这些第一梯队还有距离,比如Gemini 2.0 Flash成本比DeepSeek更低,能力也很强,且全模态,外界低估了Gemini 2.0为代表的第一梯队的能力,只是没有开源而获得这么炸裂轰动性的效果。

DeepSeek很让人兴奋,但还不能称作范式级创新,更准确的表述是将之前OpenAI o1半遮半掩的范式开源,将整个生态推向很高渗透率。

从第一性原理角度,在Transformer这一代架构下超越第一梯队模型厂商是有难度的,同样路径下很难实现弯道超车可能,今天更期待有人能探索出下一代的智能架构和范式。

Insight 02:DeepSeek 开启新范式了吗?

就像前面说的,严格意义上说,DeepSeek 没有发明新范式。但DeepSeek的重要意义在于帮助RL和test time compute这个新范式真正出圈。如果说OpenAI最初发布的o1是给行业出了一个谜语,DeepSeek就是第一个公开解谜的人。

DeepSeek发布R1和R1-zero之前,行业只有少部分人在实践RL和reasoning model,但DeepSeek给大家指明了路线图,让行业相信这样做真的能提升智能,这对提升信心,吸引更多人转向新范式的研究有巨大的帮助。

有人才进入,才有算法创新,有开源紧追才有更多计算资源投入。在DeepSeek之后,原本计划不再发新模型的OpenAI接连发出o3mini,并计划继续发布o3,还考虑开源模型。Anthropic和Google也会加快RL的研究。行业对新范式的推进因为DeepSeek加快。

另外,reasoning model的提升会进一步帮助Agent落地,AI researcher现在都因此对agent的研究和探索更有信心,因此也可以说DeepSeek开源reasoning model推进了行业向Agent的进一步探索。所以 DeepSeek虽然没有发明新范式,但推进整个行业进入了新范式。

Insight 03:Anthropic的技术路线和R1有什么不同?

从Dario(Anthropic创始人)的访谈可以看出,Anthropic对R-1/reasoning model的理解,与O系列有些分歧,Dario觉得基础模型与推理模型应该是个连续光谱,而非OpenAI这种独立的模型系列。如果只做 O系列会很快遇到天花板。

我一直想为什么Sonnet 3.5的coding、reasoning 和 agentic能力一下子提升这么强,但4o一直没追上?他们在基础模型预训练阶段就做了大量RL工作,核心还是把基础模型的能力提上去,不然只靠RL提升推理模型可能很容易把收益吃光。

Insight 04:DeepSeek的轰动有必然,也有偶然

两位OpenAI的早期研究员写的《为什么伟大不能被计划》一书用来形容DeepSeek也很合适。

技术角度上,DeepSeek有下面几个亮点:

? 开源:这点很重要,OpenAI从GPT-3开始转为闭源公司后,第一梯队三巨头就不再公开技术细节,拱手让出了一个空白的开源生态位,但Meta和Mistral并没有接稳这个位置,DeepSeek这次堪称奇袭,在开源这块大赛道一马平川。

如果把轰动性打100分,智能提升贡献30分,开源贡献70分,之前LLaMA也开源但没有这么轰动的效果,说明LLaMa智能水平不够。

? 便宜:“Your margin is my opportunity” (你的利润就是我的机会)这句话的含金量还在上升。

? 联网+公开CoT(思维链):对于用户,这两个点分别都能带来很好的用户体验,DeepSeek把两张牌同时出了,可以说是王炸,给到C端用户的体验和其他Chatbot完全不一样。尤其是CoT透明,把模型思考过程公开了,透明能让用户对AI更信任,促进了破圈。不过,按理说Perplexity也是冲击很大的,但DeepSee 服务端不稳定,Perplexity团队快速反应上线了R-1反而承接了很大DeepSeek R-1溢出的用户。

? RL泛化:虽然RL是OpenAI o1最先提出来的,但因为各种运营一直半遮半掩,渗透率并不高,DeepSeek R-1很大意义推动了reasoning model范式的进程,生态接受度大幅提升。

DeepSeek在技术上的探索投入是被这个智能成果值得更多人关注、讨论的确定性因素,但DeepSeek R1 推出的时间点又让这场轰动带有偶发性:

? 过去美国一直讲自己在基础技术研究上大幅领先,但DeepSeek原生于中国国内,这本身也是一个亮点,这个过程中,又有很多美国科技大佬开始去宣扬DeepSeek挑战了美国科技霸主的地位的论调,DeepSeek属于被动卷进舆论战;

? DeepSeek R1发布之前,美国5000亿美元的“星际之门”事件刚刚开始发酵,这种巨量投入和DeepSeek团队智能产出效率对比太鲜明了,很难不引发关注、讨论;

? DeepSeek让英伟达股价大跌又进一步让舆论发酵,他们肯定也想不到自己成为了2025开年美股第一只黑天鹅;

? 春节是产品的练兵场,移动互联网时代很多超级App都是在春节大爆发的,AI时代也不例外。DeepSeek R1恰好在春节前发布,大众惊喜的是它的文字创作能力,而不是训练时候强调的编程和数学能力,文创更容易被大众用户有体感,也更容易迅速传播。

Insight 05:谁受伤?谁受益?

可以把这个赛场上的玩家分成三类:ToC(消费者)、To Developer(开发者)以及 To 企事业单位:

1. ToC:Chatbot 肯定受冲击最大,心智和品牌关注度被DeepSeek抢走了,ChatGPT也不例外;

2. 在开发者环节的影响很有限,我们看到有用户用完之后说评论r1不好用不如sonnet,Cursor官方也说 Sonnet还是表现更好,用户高比例都选择Sonnet,并没有大幅迁移;

3. 第三个维度,To Enterprise和To Government的生意在于信任和需求理解,大型组织做决策的利益考虑很复杂,不会像C端用户那么容易迁移。

再换个角度,从闭源、开源和算力的视角想这个问题:短期大家会觉得闭源的OpenAI/Anthropic/Google 更受冲击:

? 技术神秘感被开源了,AI营销里面最重要的神秘感的溢价被打破;

? 更现实的因素,市场认为这几家闭源公司的潜在客户和市场规模被抢走了一些,GPU投入的回本周期变长;

? 作为领头羊的OpenAI在其中属于最“吃亏”的那个,之前想捂着技术不开源,半遮半掩,希望多赚技术溢价的美梦无法实现了。

但中长期看,GPU资源充裕的公司还是受益的,一方面是第二梯队的Meta可以快速跟进新方法,Capex更加高效,Meta可能是很大受益者,另一方面是智能提升还需要更多探索,DeepSeek开源把大家水平拉齐,进入全新探索又需要10倍甚至更大量级的GPU投入。

从第一性原理来想,对于AI智能产业来说,无论是发展智能还是应用智能,从物理本质上就必然要消耗海量算力,这是基础定律决定的,不是技术优化能完全规避的。

所以,无论是探索智能,还是应用智能,即便短期有质疑,中长期的算力需求也会爆炸,这也解释了为什么马斯克从第一性原理出发,xAI坚持扩建集群,xAI和“星际之门”背后的深层逻辑也许是一样的。Amazon 等云厂商都宣布了要增加资本支出。

我们就假设全球的AI research人才水平和认知都拉齐,有更多GPU就可以做更多实验探索?最后可能还是回到算力的竞争。

DeepSeek光脚不怕穿鞋,没有商业化诉求,专注AGI智能技术探索,开源这个动作对推动AGI进程推动意义很大,加剧了竞争,推动了开放性,颇有鲶鱼效应。

Insight 06:蒸馏能超越SOTA吗?

有个细节点不确定,如果DeepSeek从预训练阶段就大量使用蒸馏的CoT数据,那做到今天效果不算惊艳,还是在第一梯队巨头的肩膀上获得的基础智能,然后再开源出来;但如果预训练阶段没有大量用蒸馏数据,DeepSeek从0做预训练做到今天的效果,那就堪称惊艳了。

另外,蒸馏能否在基础模型超越SOTA(效果最好的模型),应该是不太可能的。但DeepSeek R-1非常强,猜测是奖励模型做的非常好,如果R-1 Zero这条路径靠谱,是有机会超越SOTA。

Insight 07:No Moat !

Google之前对OpenAI的一个评价:No Moat!(没有护城河)这句话放在这里也很应景。

DeepSeek这一波Chatbot用户又出现了大量迁移现象,给了市场一个很重要的启发:智能技术进步非常陡峭,阶段性产品很难形成绝对壁垒。不管是 ChatGPT/Sonnet/Perplexity 刚形成了心智和口碑,还是 Cursor、Windsurf 这类开发者工具,一旦有了更智能的产品,用户对“上一代”智能的产品毫无忠诚度,今天不管是模型层还是应用层都很难构建护城河。

DeepSeek这次也验证了一件事:模型即应用,DeepSeek在产品形式上没任何创新,核心就是智能+开源,我也不禁思考:在AI时代,任何产品和商业模式的创新都比不上智能的创新吗?

Insight 08:DeepSeek 应该承接这波 Chatbot 流量并做大吗?

从Chatbot 爆火到今天,通过DeepSeek团队的反应可以明显感觉出来,DeepSeek还没想好怎么用这波流量。而要不要接住、并积极运营这批流量这个问题的本质是,伟大的商业公司和伟大的研究机构能共存在一个组织吗?

这件事非常考验精力和资源分配、组织能力和战略选择,如果是字节、Meta这类大公司,他们的第一反应应该都要接下来,也有一定组织基础可以接下来,但DeepSeek作为一个研究团队组织,承接这波巨量流量的压力必然很大。

但同时也要想这一波Chatbot会是阶段性流量吗?Chatbot是不是在未来智能探索的主线下?似乎感觉每个智能阶段都有对应的产品形态,而 Chatbot只是解锁的其中一个早期形态。

对于DeepSeek来说,从未来3-5年视角看,如果今天不去承接Chatbot流量,会不会是一种错过?万一哪天跑出规模效应?如果AGI最终实现了,又会是什么载体来承接?

Insight 09:下一个智能突破的Aha moment从哪来?

一方面,第一梯队的下一代模型很关键,但今天我们又处在Transformer的极限边界上,第一梯队能否拿出代际提升的模型也不确定。OpenAI、Anthropic和Google作为回应发出来好30%-50%的模型可能都不够挽回局势,因为他们资源多了10-30倍。

另一方面, Agent落地比较关键,因为Agent需要做长距离多步骤推理,如果模型好5%-10%,领先的效果就会被放大很多倍,所以OpenAI、Anthropic和Google一方面要做Agent产品落地,全栈集成模型+Agent产品,就像 Windows+Office,二是也要秀出来更强大的模型,比如O3完整版、Sonnet 4/3.5 opus为代表的下一代模型。

在技术不确定性下,最宝贵的是天才AI研究员,任何想要探索AGI的组织都要投入资源到更激进的范式,尤其是在今天预训练阶段已经被拉齐的背景下,要有好的人才+充裕资源,探索下一个智能涌现的Aha moment。

Insight 10:DeepSeek 这一波让我对中国AI人才更有信心,非常鼓舞

最后,希望技术无国界。

(本文首发于微信公众号海外独角兽,海外独角兽为拾象旗下开源研究平台)

来源:李广密/拾象科技创始人兼CEO

(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)

相关推荐

别让水 “跑” 出卫生间!下沉设计打造滴水不漏的家

你是否遭遇过卫生间的水“偷偷溜”进客厅,导致木地板鼓起、墙角发霉的糟心事?又是否为卫生间门口反复渗漏,不得不一次次返工维修而头疼不已?在家庭装修中,卫生间防水堪称“兵家必争之地”,而卫生间门口下...

歼-10CE vs 阵风:谁才是空中霸主?全面性能对比解析

歼10CE与法国阵风战斗机性能深度对比分析一、总体定位与设计哲学歼10CE:单发中型多用途战斗机,侧重于空优(制空权争夺)和对地对海打击,具有较高的性价比和较强的多任务能力。法国阵风战斗机:双发中型多...

知名移植工作室肯定Switch2的图形性能,却被CPU拖了后腿

虽然Switch2发售多日,但没入手的玩家对其性能还是有顾虑。近日,知名移植工作室Virtuos的技术总监在接受采访时讨论了Switch2的性能,并给出了他们工作室的评价。简单来说,Switch2在D...

虹科实测 | CAN XL vs CAN FD传输性能深度对比:速率翻倍,抖动锐减!

导读在汽车电子与工业通信领域,CAN协议持续进化,推动着数据传输效率的提升。本次实测基于虹科PCAN-USBXL与虹科PCAN-USBProFD硬件,在同等严苛条件下对比CANXL与CANF...

1J117合金材料优异的耐腐蚀性、机械性能

1J117合金材料概述定义:1J117是一种不锈软磁精密合金,属于铁铬基合金,其圆棒产品具有特定的形状和尺寸,可满足各种工业应用中的特定需求。标准:技术条件标准为GB/T14986,品种规格标准...

据高管所称,Switch2能轻松移植XSS平台60帧游戏

任天堂,作为主机游戏界的御三家之一,一直注重游戏性而不注重更新升级硬件设备是其最大的特点。各位任豚们,忍受着任天堂早已落后硬件设备,真想感叹一句,天下苦任久矣!但Switch2的出现或许正在渐渐的改变...

FJK-110LED-HXJSN磁传感器有哪应用

作为一名从事电子技术相关工作的自媒体人,我经常会遇到各种传感器的应用问题。其中,FJK-110LED-HXJSN磁传感器是一款在工业自动化、智能设备等领域比较常见的磁场检测元件。今天我想和大家聊一聊这...

浅谈欧标方管200x200x5-12mm质S275JRH的优势与劣势

欧标方管200x200x5-12mm材质S275JRH是一种常见的结构用钢材,广泛应用于建筑、机械制造、桥梁、钢结构等领域。本文将对这种方管的优势与劣势进行浅谈,以帮助读者更好地了解其特性和适用场景。...

宽带拨号错误 651 全解析:故障定位与修复方案

在使用PPPoE拨号连接互联网时,错误651提示「调制解调器或其他连接设备报告错误」,通常表明从用户终端到运营商机房的链路中存在异常。以下从硬件、系统、网络三层维度展开排查:一、故障成因分类图...

模型微调:从理论到实践的深度解析

在人工智能领域,模型微调已成为提升模型性能、使其适应特定任务的关键技术。本文将全面系统地介绍模型微调的各个方面,帮助读者深入理解这一重要技术。一、什么是模型微调模型微调是指在已经训练好的预训练模型基础...

汉语拼音 z、c、s图文讲解(拼音字母表zcs教学视频)

以下是汉语拼音z、c、s的图文讲解,结合发音要领、书写规范及教学技巧:一、发音方法与口诀1.z的发音发音要领:舌尖轻抵上齿背,形成阻碍后稍放松,气流从窄缝中挤出,声带不振动(轻短音)。口诀:“写字写...

吴姗儒惹怒刘宇宁粉丝!吴宗宪护航「是综艺梗」叮咛女儿对话曝光

记者孟育民/台北报道Sandy吴姗儒在《小姐不熙娣》因为节目效果,将男星刘宇宁的头像踩在地上,引起粉丝怒火,节目发声明道歉后仍未平息,她也亲自发文郑重道歉:「我对刘宇宁本人完全没有任何恶意,却在综艺表...

苹果错误地发布了macOS Tahoe公开测试版 现已将其撤下

一些Beta测试人员下载了他们以为是macOSSequoia15.6RC的版本,但却错误地下载了macOSTahoe26公开测试版,后来苹果修复了该问题。苹果预计将于7月25...

make的多种用法!(make 的用法总结)

一、make的用法美make[meik]①V.制造;制定,拟定;使变得,使处于;造成,引起;整理(床铺);做,作出;强迫;挑选,任命…②n.(机器、设备等的)品牌,型号;结构,构造;通电,接电⑤[...

北顿尖刀哗变?俄第20近卫集团军损失惨重,拒绝执行指挥官命令?

【军武次位面】作者:太白近日,外国社交媒体“电报”上传出了一些消息,称俄罗斯在北顿涅兹克战场上的“尖刀”部队之一,俄第20近卫集团军因为损失惨重,已经出现了部分部队拒绝执行指挥官命令,甚至哗变的情况。...