
01
在短短一天内,DeepSeek竟然成为了欧美科技股的梦魇。
截至27日美股收盘,英伟达(NVIDIA)的股价狂跌16.97%,市值在一夜之间蒸发近6000亿美元,折合人民币约4.3万亿,这也是美国历史上任何公司在单日内最大的市值损失。
据福布斯的报道,该公司首席执行官兼最大个人股东黄仁勋,收盘时净资产锐减了208亿美元。
而且,其他知名科技公司也都没有逃过这一劫。

博通的股价下降了17%,超威半导体(AMD)股价也下跌了6%,微软则跌了2%……
此外,连电力供应商这样的人工智能相关公司也遭到重创,美国联合能源公司的股价下滑21%,Vistra则跌了29%……
这次市场的巨变,竟是由一家刚成立于2023年的中国人工智能初创企业——深度求索公司引发的。

它旗下的产品,如今正被广泛追捧,被业内专家视为能够打破国际巨头在人工智能领域垄断的DeepSeek。
这款和ChatGPT类似的语言模型,不仅具备强大的自然语言处理能力,能够理解并回答各种问题,还能帮助编写代码、整理资料,甚至解决复杂的数学难题。
最让人惊讶的是,它的成本仅为前者的十分之一,但在表现上却丝毫不逊色,甚至可以说更出色。
低成本意味着可以以更低的价格进入市场,再加上强大的性能,这样的组合势必会让它在AI市场上大放异彩。
其实,DeepSeek并不是第一次震撼世界。
早在20日发布的DeepSeek-R1推理模型正式版,在数学、代码和自然语言推理等方面的表现就已与OpenAI的o1正式版相提并论。
不同的是,它还同步开放了模型权重,允许用户利用模型输出和蒸馏等方法训练其他模型,海外人士称之为“真正开放的人工智能”。
这一发布更被业内人士称为AI行业的“偷袭珍珠港”事件。
就连英伟达的高级研究科学家Jim Fan在评价这款模型时也表示:
我们生活在这样一个时代:一个并非美国公司的AI企业,居然实现了OpenAI成立时的愿景——推动真正开放的前沿研究,赋能所有人。
这个模型的背后,中国团队更是被西方科技圈赞誉为“神奇的中国力量”。
年轻力量:从小镇到全球AI舞台的传奇

你可能想不到,这些能在全球AI领域引发波澜的幕后英雄,实际上并不是那些资深的行业专家,而是一群刚毕业或工作没几年的小年轻。他们用实力让中国人工智能在国际舞台上展现出色彩,把ChatGPT都比下去了。
这群年轻人的平均年龄只有28岁,他们不怕任何对手,个个都能担负起重任,展现了他们在这一领域的强大实力。

02
说到DeepSeek的成功,真是绕不开一个核心人物。
那就是公司的创始人,85后的小伙子梁文锋。

梁文锋于1985年出生在广东湛江,这个城市虽然不算发达,特产也就生蚝,但在经济上有些滞后,算是三线城市。
不过,不得不承认,这种地方往往能孕育出一些惊人的人才。
关于梁文锋的成长经历,虽然不为人知,但听说他的父亲是一名小学老师,教育方式既开明又严格。
从小,梁文锋在数学和科学方面展现出惊人的天赋,他对这两门学科的敏感度远超同龄人,因此老师和同学们都认为他是个“学霸”。
在学业上表现出色的他,完全没有被家乡教育水平的限制,利用一切时间深入研究各种知识,兴趣成了他最好的老师,使得他迅速掌握了许多同龄人无法理解的内容,为未来的学习打下了坚实的基础。
2002年,17岁的梁文锋以优异的成绩考入浙江大学电子信息工程专业,成为家族里第一个进入如此顶尖高校的人。
他的专业在当时的浙大可是个热门,吸引了不少科技公司的注意。
但是,梁文锋并没有止步于此,而是在本科四年里,不仅扩展视野,还不断提升学术水平,积极参与数学建模竞赛,未毕业就已在学术界小有名气。
后来,他还在浙大攻读硕士学位,研究方向从电子信息转向更前沿的机器视觉,师从这一领域的专家项志宇教授。

2013年,梁文锋和他的浙大校友徐进一起创立了杭州雅克比投资管理有限公司,正式进入了量化投资的领域。
虽然当时中国的相关技术还在起步阶段,但梁文锋坚信他所从事的工作一定是金融行业的未来。
做大事的人,眼光必定要放得长远。
正是这种眼光,让他在30岁时与徐进共同创立了幻方量化,利用技术重新定义投资策略,力争通过数学建模和人工智能,成为全球顶尖的量化对冲基金。
到了2016年,梁文锋带领团队推出了第一个基于深度学习算法的AI模型,并将GPU应用于交易仓位的计算,这在国内量化领域算是开了个先河。
没想到,这一步走得特别成功,接下来的几年,梁文锋不断扩大AI算法的研究团队,将人工智能技术深度融入到量化策略中。
2018年,幻方量化首获中国私募证券领域的最高荣誉——私募金牛奖,从而跻身行业领先者行列。
不过到了2021年底,由于市场波动和技术决策的问题,幻方的业绩遭遇了一些回撤,敏感的梁文锋又开始寻找新的增长领域。
2023年,38岁的他再次选择站在技术潮流的前沿,创办了深度求索(DeepSeek),专注于AI大模型的研发。
令人惊讶的是,这个成立仅一年的公司在2024年就展现出强劲的增长,凭借创新的思维和市场定价策略,每百万tokens以1元输入、2元输出的性价比,以及与GPT-4 Turbo媲美的性能,迅速成为全球用户的新宠。
这其中不仅有团队的努力,更离不开明智的领导者。

03
这里面还有一位关键人物,那就是最近被雷军开出高达千万年薪、力争挖掘的95后AI天才——罗福莉。
出生于四川小镇的罗福莉,与她的领导梁文锋一样,出身普通家庭,成功完全得靠自己的努力。
对她来说,甚至是半路出家,还差点放弃了。
虽然她小时候学习成绩不错,但在进入大学之前,罗福莉根本没想到自己的人生会和计算机有任何关联,甚至在大学前,她连C++都没接触过。
在高考时,她非常渴望去大城市上学,结果“被调剂”进了北师大,最后被分配到了她非常不喜欢的电子专业。
大一时,她花了半年的时间学习C++,才明白这是一门专业课程,那时她的班上四五十个人,自己的成绩常常在三十名开外。别的同学三分钟能解决的编程题,她要花上三个小时。
直到大二时,不知怎么突然开窍了,为了保研的硬性条件,她开始死记硬背,没想到这真的奏效,成绩迅速上升到了班级前五名。
就这样,在拼命学习的过程中,罗福莉找到了乐趣,一边联系北大的老师,一边寻找自己想进的实验室。
那时她找的老师手下总共十个人,其中九个都是男生,环境虽然有些尴尬,但她还是努力克服,尽管老师布置的作业常常让她摸不着头脑。
然而,罗福莉最厉害的就是在逆境中不断突破自己。
当退路已无时,唯有行动才能带来进步。
她开始充分利用假期和春节等时间,找学长辅导,同时自己也加紧学习,甚至某年的春节只在家待了一天,就回学校写论文。
凭借这股拼劲儿,罗福莉不仅逐渐赶上了其他人的步伐,还超前完成了老师布置的任务,慢慢找到了未来工作的方向,坚定了在自然语言处理领域的兴趣和研究。
在研究生阶段,她更是加大了论文的撰写工作,甚至一次性通过了五六篇论文的审核。
因为这些论文的发表,罗福莉在某乎上成为了这个领域的“大神”。
毕业后,她首先去了阿里达摩院,负责阿里深度语言模型体系(AliceMind)的开源工作,还主导开发了AI预训练模型VECO,在电商领域大显身手,特别是在阿里速卖通的跨境电商业务中发挥了巨大作用。
就在很多人觉得可以安逸的时候,罗福莉却选择了打破自己的舒适圈,仅仅工作两年后便转职到幻方量化,专注于深度学习策略建模和算法研究,这与她在达摩院的工作大相径庭。
没过多久,她又加入了DeepSeek,担任深度学习研究员,成为了公司主打产品DeepSeek-V2的重要开发者之一。
基于DeepSeek-V2的成功,罗福莉凭借超强的能力吸引了雷军的目光,成为了他三顾茅庐也想挖的人才。

04
说到DeepSeek团队,里面可是人才济济,随便拉出来一个都能让你刮目相看。
拿DeepSeek-V2来说,它是其他大模型公司能突破关键瓶颈的重要一环,最厉害的地方在于它引入了一种新型的注意力机制,替代了老旧的多头注意力,结果是计算量和推理显存都大大减少了。
在这个过程中,贡献巨大的两位英雄就是高华佐和曾旺丁。
高华佐这个人非常低调,目前只知道他是北大物理系的毕业生。
他的名字还出现在“大模型创业六小强”之一的阶跃星辰的专利名单里,不过不确定是不是同一个人。
而曾旺丁则来自北邮,他的研究生导师是北邮人工智能与网络搜索教研中心的张洪刚教授。
还有,DeepSeek-V2的成功离不开一种关键的变体算法,这个算法的出现让训练资源的需求大为减少。
有趣的是,这三位都在实习期间完成了这项重要的工作。
核心成员之一的邵智宏,清华大学交互式人工智能(CoAI)课题组的博士生,师从黄民烈教授。
他之前在微软研究院工作,研究的领域包括自然语言处理和深度学习,尤其对构建稳健且可扩展的AI系统充满兴趣。
另一位核心成员朱琪豪,是北大计算机学院软件研究所2024届的博士生,受熊英飞副教授和张路教授指导,专攻深度代码学习。
从北大计算机专业的网站上可以看到他的成就:
朱琪豪已经发表了16篇CCF-A类论文,在ASE和ESEC/FSE上分别获得过一次ACM SIGSOFT杰出论文奖和提名,还有一篇论文在ESEC/FSE会议同年被引用次数排前三。

在团队里,朱琪豪还根据自己的博士论文工作,主导了DeepSeek-Coder-V1的开发。
他的博士论文《语言定义感知的深度代码学习技术及应用》也被纳入了2024CCF软件工程专业委员会的博士学位论文激励计划。
还有一位核心成员Peiyi Wang,来自北大,受到北京大学计算语言学教育部重点实验室穗志方教授的指导。
此外,团队里还有其他一些关键人物,基本都是北大和清华的优秀学子,都是在学习期间就已经名声在外的人物。
正如一位AI行业的人才猎头向媒体所描述的那样:
DeepSeek的薪资待遇相当有竞争力,这让他们对人才的吸引力一直很强,最初团队规模就有百人,个个都非常出色。
而且,这个团队的一个显著特点就是年轻,北大和清华的应届生、在读生们都非常活跃。
他们关注的是实力,而不是经验,招聘风格也别具一格。
据一些应届生的反馈,“只招1%的天才,去完成99%中国公司无法做到的事情”。
因此,团队中的每一个人都充满了创新和活力。
当然,这也和梁文峰的管理理念密不可分,他从不限制大家的想法和创造力,只要你有需要,他会协调无限的算法资源供你使用。
此刻是不是该高呼一句:
中国在人工智能领域的未来,必将屹立于世界之巅。

DeepSeek的崛起真是令人惊叹,竟然能在短时间内给国际巨头带来如此大的冲击,年轻团队的实力让人刮目相看。这样的技术进步对整个AI行业都是个激励。
DeepSeek的出现让我对中国AI的未来充满期待,年轻团队展现出的创新能力与实力真是令人振奋。希望他们继续保持这种势头!
DeepSeek的低成本和高性能真是颠覆了市场,年轻团队的突破让人惊喜,未来的AI竞争会更加激烈。
DeepSeek的成功不仅是技术上的突破,更是年轻团队的智慧与努力结晶。他们的表现让人对中国AI的未来充满希望,期待他们继续引领行业潮流。
DeepSeek的迅猛崛起让人惊喜,年轻团队展现的实力和创新能力超乎想象,未来的AI市场将因他们而变得更加多元化。
DeepSeek的成功真是一个震撼,年轻团队的创造力和勇气让我对未来的AI发展充满信心。这样的突破必将改变行业格局。
DeepSeek的表现真是令人惊艳,年轻团队竟然能在短时间内撼动行业巨头,这种创新精神值得赞赏。期待他们继续引领AI发展!