18岁中国高中生的神奇之旅:揭秘DeepSeek刷屏论文背后的故事

作品声明:内容取材于网络

昨天,整个网络都在热议 DeepSeek 登上《Nature》封面的相关新闻,真是炸裂了!

18岁中国高中生的神奇之旅:揭秘DeepSeek刷屏论文背后的故事

DeepSeek 的官方也发了声明,回应了大家的热议:

与早期发布在 arXiv 的预印版本相比,这次在《Nature》上的发表增加了更多的实现细节和实验分析。我们相信,这些新信息能帮助大家更好地理解和构建先进的推理模型。

过去一年,我们见证了人工智能推理模型的迅猛发展,未来我们会继续努力,推动人工智能研究的进步。

18岁中国高中生的神奇之旅:揭秘DeepSeek刷屏论文背后的故事

说到这里,梁文锋作为通讯作者本身就很抢眼,然而细心的网友却发现,这篇《Nature》论文的作者名单中还出现了两位大家熟悉的名字——涂津豪和罗福莉

18岁中国高中生的神奇之旅:揭秘DeepSeek刷屏论文背后的故事

说到涂津豪,他可是个93年出生的天才,2024年在阿里巴巴全球数学竞赛新开的AI赛道上,以惊人的34分(当时的最高分)从563支高校和企业队伍中脱颖而出,拿下了第一名。

18岁中国高中生的神奇之旅:揭秘DeepSeek刷屏论文背后的故事

他在比赛中采用的思路真的是别出心裁,利用“自辩论”的理念,让多个大模型进行多轮的“自问—自答—自验证”,最终再从中选出最佳答案。

而且,这位高中生还有另一个令人惊叹的成就,那就是通过极具创意的提示词技巧,把Claude 3.5改造成了“Thinking Claude”

据说,涂津豪在创建“Thinking Claude”的提示词时,他把初版的提示词反馈给AI,要求其自我思考并改进,经过反复的调整,最终让Claude 3.5展现出类似OpenAI推出的o1思维链的深度推理能力。

18岁中国高中生的神奇之旅:揭秘DeepSeek刷屏论文背后的故事

截至目前,这个提示词在Github上已经获得了15.6k个stars,真是相当了不起的成绩。

涂津豪的神级提示词完整版

18岁中国高中生的神奇之旅:揭秘DeepSeek刷屏论文背后的故事

聊聊AI与学习:涂津豪的思考与经验

想了解更多吗?可以去看看他的GitHub页面,真的很有趣!

https://github.com/richards199999/Thinking-Claude

18岁中国高中生的神奇之旅:揭秘DeepSeek刷屏论文背后的故事

在世界人工智能大会(WAIC)的一次采访中,他提到过一个非常重要的观点:“思考过程”其实是推理质量的关键。他认为让模型在不确定的情况下“慢一点,查一查”比直接给出答案要重要得多。

提到AI模型的幻觉问题,涂津豪的看法也很有趣。他认为虽然我们知道模型可能会出现幻觉,其实人类自己也会经历这样的情况,这在某种程度上反而反映了创造力。

作为一位00后,他对于如何激发对AI的兴趣有自己独到的见解。

在《WAIC UP!》的采访中,他强调了一个关键点:“多用,真的特别重要。”现在的模型不仅仅是工具,更像是朋友和伴侣,你可以根据自己的需求去定义它的角色。

18岁中国高中生的神奇之旅:揭秘DeepSeek刷屏论文背后的故事

他总结说:“一开始我把它当玩具,觉得特别有趣,慢慢地就开始思考它是怎么思考的。这样的兴趣驱使我去看博客、查资料,积累知识,真的很有效。”

根据公开资料显示,他在多个播客和科技媒体的采访中,探讨了“幻觉创造力”和没有工程背景如何塑造模型等话题,真的是00后AI实践者的代表。

而另一位贡献者罗福莉也是个很厉害的人物,她在北京师范大学读计算机,后来又保送到北京大学学习计算语言学。

95后AI天才的成长之路

在2019年,她还在研究生阶段,就已经以「一作2篇、共8篇」的惊人速度在NLP顶会ACL上崭露头角。凭借这股劲头,她顺利拿到了阿里星、腾讯等大公司的offer,最终选择加入阿里达摩院,负责AliceMind开源项目里的多语言预训练模型VECO。

18岁中国高中生的神奇之旅:揭秘DeepSeek刷屏论文背后的故事

到了2022年,她转战到量化私募领军企业幻方量化,专注于深度学习策略建模。2023年,她又加入了幻方旗下的新创公司DeepSeek,成为核心研发团队的一员,参与开发MoE大模型DeepSeek-V2。

在2024年5月发布V2的时候,她在知乎上表示,这款模型的中文能力在国内外的闭源模型中都名列前茅,而且它的API定价仅为GPT-4的1/100,真的是个性价比之王。

18岁中国高中生的神奇之旅:揭秘DeepSeek刷屏论文背后的故事

根据Google Scholar的数据,罗福莉的总引用量达到了10025次,h指数为27,i10指数为34。她的学术成果主要集中在DeepSeek系列大模型的研究和技术报告上。

她的代表性论文包括Deepseek-r1(2025年,引用3596次)、Deepseek-v3技术报告(2024年,引用1809次)、DeepSeek-Coder(2024年,引用1129次),以及DeepSeek-llm、DeepSeekMoE和Deepseek-v2等多篇作品。

18岁中国高中生的神奇之旅:揭秘DeepSeek刷屏论文背后的故事

在2024年底,媒体纷纷报道「小米创始人雷军开出千万年薪挖角罗福莉」的消息,她因此被贴上了「95后AI天才少女」的标签,广受关注。

她拒绝“天才”标签,呼唤安静的工作环境

其实,她在朋友圈里很快发声,拒绝了大家对她的“天才”称号,表示希望能够有一个安静的空间来专注于工作。她强调自己并不是所谓的天才,只是想做一些困难但正确的事情。

有趣的是,她在知乎的简介中也提到,希望各大自媒体能够停止对她的神话和消费。

在今年2月,亲属向媒体确认她已经入职新的岗位,但具体公司名并没有透露,小米的内部系统也没有她的记录,至于她是否真的加入,仍然是个谜。《Nature》上的资料信息仅显示她是一名独立研究者,位于中国北京。

18岁中国高中生的神奇之旅:揭秘DeepSeek刷屏论文背后的故事

不过,话说回来,个人的力量虽大,但团队的合作才能成就更远大的目标。每位参与论文的署名者都在其中留下了自己的贡献,这份在《Nature》上刊登的光荣,理应属于整个团队,甚至是所有在AI领域共同探索的人们。

同时,这也反映出一个趋势:中国的AI人才正在全球学术舞台上越来越频繁地出现。作为第一个经过同行评审的主流大语言模型,这次中国AI的表现,真的让世界刮目相看啊。

相关链接汇总:

DeepSeek Nature 论文:
https://www.nature.com/articles/s41586-025-09422-z

补充材料:
https://static-content.springer.com/esm/art%3A10.1038%2Fs41586-025-09422-z/MediaObjects/41586_2025_9422_MOESM1_ESM.pdf

同行评审:
https://static-content.springer.com/esm/art%3A10.1038%2Fs41586-025-09422-z/MediaObjects/41586_2025_9422_MOESM2_ESM.pdf

Nature 编辑文章:
https://www.nature.com/articles/d41586-025-02979-9

Nature 新闻:
https://www.nature.com/articles/d41586-025-03015-6

DeepSeek 原 arXiv 论文:
https://arxiv.org/pdf/2501.12948

来源:今日头条
原文标题:DeepSeek刷屏论文背后:18岁中国高中生,曾写出神级提示词 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

发表评论