哇,真是太精彩了!
大家关注的AI大模型评测平台Chatbot Arena终于公布了最新结果。
阿里
Qwen3-235B-A22B-Instruct-2507荣登大语言模型总榜的第三名,而月之暗面Kimi-K2-0711-preview和深度求索DeepSeek-R1-0528则一起并列第五,这两个开源模型甚至还超越了Claude 4和GPT-4.1这些顶尖的闭源模型,真是厉害。

在多模态大模型的评比中,字节的图像生成模型Seedream-3居然拿到了文生图榜的第五名,而字节的图像编辑模型Seededit-3.0、字节的开源多模态基础模型BAGEL和阶跃星辰的开源图像编辑模型Step1X-Edit分别位列图像编辑榜的第五、第七和第八名。
在7月30日发布的Chatbot Arena编程榜单中,深度求索Deepseek-R1-0528和阿里Qwen3-Coder并肩占据了第一的位置,而月之暗面Kimi-K2-Instruct则排在了第七。

值得一提的是,阿里
Qwen3-235B-A22B-Instruct-2507、阿里Qwen3-Coder、月之暗面Kimi K2都是在7月刚刚发布的开源模型哦。
在7月末和8月初的这段时间里,中国的AI大模型依旧在不断推出新作品,字节跳动、阶跃星辰、阿里和月之暗面这些公司最近都接连发布了新模型的消息。
比如说,周四晚上,字节跳动的Seed团队发布了一款实验性的扩散语言模型Seed Diffusion Preview,而阶跃星辰则推出了开源基础大模型Step3。紧接着在周五,阿里也开源了一款“甜品级”的编程模型
Qwen3-Coder-30B-A3B-Instruct,而月之暗面则发布了Kimi-K2的高速版kimi-k2-turbo-preview。
Hugging Face在周五还总结了7月份中国AI社区的重点,回顾了这个月里让人目不暇接的开源潮流,包括:
✨ 另一个“DeepSeek时刻”——Kimi K2
✨ Qwen完全矩阵化——Instruct / Thinking / Coder模型覆盖30B至480B参数规模
✨ 多模态的浪潮:
- GLM-4.1V-Thinking: 图像+文本 > 文本
- Intern-S1: 图像+文本 > 文本
- Wan 2.2 – 文本+图像 > 视频
- Skywork-R1V3: 图像+文本 > 文本
- Skywork-UniPic: 文本 > 图像 / 图像 > 文本
- Tar-7B: 任意到任意
- Ming-Lite-Omni-1.5: 任意到任意
- Step3: 图像+文本 > 文本
- HunyuanWorld-1: 图像 > 3D
- ThinkSound: 视频 > 音频
- Neta-Lumina: 文本 > 图像
✨ 轻量级、可部署的模型
- SmallThinker仅需1GB内存即可运行
✨ Agentic编程逐渐成为主流
- Qwen3-Coder: 完全支持工具调用
- GLM-4.5: 浏览器代理,IDE助手
- Qwen3 WebDev演示: 文本转前端代码
✨ 针对特定领域和实用的模型/工具/数据集
- Science one S1: 科学模型
- Agentar DeepFinance: 财务数据集
- ObjectClear: 交互式视觉工具
- Qwen3 MT Demo: 机器翻译工具
总结一下,7月份的开源模型中有31个亮点、1个框架和1个数据集,来自16家企业、高校或研究机构,包含阿里(9个)、月之暗面(2个)、智谱(2个)、阶跃星辰(1个)、字节跳动(2个)、昆仑万维(2个)、智源研究院(1个)、中国电信人工智能研究院(1个)、蚂蚁集团(4个)、快手(1个)、捏Ta(1个)、磐石(3个)、上海交通大学(1个)、腾讯(1个)、上海人工智能实验室(1个)、复旦大学(1个)等。
华人团队在AI开源领域的崭露头角
1、阿里(9个):他们推出了多款编程模型,比如Qwen3-Coder系列,以及深度思考模型Qwen3-30B-A3B-Thinking和基础模型Qwen3-235B-A22B-Instruct等。还有一些音频和视频生成模型,如ThinkSound和Wan2.2系列。
2、月之暗面(2个):推出了MoE基础模型Kimi-K2-Base,以及与Numina团队合作的数学定理证明模型Kimina-Prover-72B。
3、智谱(2个):他们的多模态大模型GLM-4.1V-9B-Thinking和基础模型GLM-4.5也颇具影响力。
4、阶跃星辰(1个):基础模型Step3。
5、字节跳动(2个):包括智能体模型Tar-7B和多语言翻译模型Seed-X-Instruct-7B。
6、昆仑万维(2个):推出了多模态推理大模型Skywork-R1V3-38B和统一模型Skywork-UniPic-1.5B。
7、智源研究院(1个):文生配音视频框架MTVCraft。
8、中国电信人工智能研究院(1个):AI-Flow-Ruyi-7B-Preview0704。
9、蚂蚁集团(4个):他们有多种多模态推理模型和金融训练数据集,比如M2-Reasoning和Agentar-DeepFinance-100K。
10、快手(1个):自适应思考模型KAT-V1-40B。
11、捏Ta(1个):动漫风格图像生成模型Neta-Lumina。
12、磐石(3个):科学基础大模型S1-Base系列。
13、上海交通大学(1个):端侧原生大模型SmallThinker-4BA0.6B-Instruct。
14、腾讯(1个):他们的3D世界生成模型HunyuanWorld-1。
15、上海人工智能实验室(1个):科学多模态大模型Intern-S1。
16、复旦大学(1个):语音生成模型MOSS-TTSD-v0.5。
前几天,Hugging Face的趋势榜上,华人团队一举包揽了前十名,其中智谱、腾讯和阿里分别占据了多个席位,还有AI大神李沐的BosonAI也在其中。
从Hugging Face最新的TOP100榜单来看,中国的AI开源团队包括智谱、腾讯、阿里、上海人工智能实验室、月之暗面、阶跃星辰、捏Ta、昆仑万维、小红书、字节跳动、蚂蚁集团、深度求索DeepSeek、快手、智源研究院,以及上海交通大学、复旦大学和香港城市大学等高校。
尽管一些企业如智象未来、美团、群核科技、百度、稀宇科技、磐石和面壁智能的模型暂时未能入围百强,但他们在中国开源AI生态中同样扮演着重要角色。
总的来看,中国积极参与AI开源的企业已经超过20家,展现出强劲的实力。
尤其是阿里,最近的开源活动频繁,推出了多款模型,涵盖了音频、推理和编程等多个领域,这样的速度和广度真是让人惊叹。
以下是最新Hugging Face趋势榜TOP100中的中国企业及其上榜模型:
1、智谱(7个):包括GLM-4.5系列及其不同版本。
2、腾讯(3个):涵盖了HunyuanWorld-1等模型。
3、阿里(18个):他们的模型包括Qwen3系列和一些基础与推理模型。
标题:看看这些中国企业在AI领域的表现吧!
最近,咱们聊到了一些中国企业在ACE趋势榜TOP100上的表现。比如,智谱公司表现不俗,有7个模型上榜,像GLM-4.5系列的不同版本都在其中。腾讯也不甘示弱,推出了3个模型,包括HunyuanWorld-1等。阿里这边则更为强劲,18个模型上榜,其中Qwen3系列和一些基础推理模型赫然在列。
4、上海人工智能实验室(2个):Intern-S1和Intern-S1-FP8。
5、月之暗面(1个):Kimi-K2-Instruct。
6、阶跃星辰(2个):Step3与OmniSVG(和复旦大学合作)。
7、捏Ta(1个):Neta-Lumina。
8、昆仑万维(1个):Skywork-UniPic-1.5B。
9、小红书(1个):dots.ocr。
10、字节跳动(1个):Seed-X-PPO-7B。
11、蚂蚁集团(1个):Ming-Lite-Omni-1.5。
12、深度求索DeepSeek(2个):DeepSeek-R1和DeepSeek-R1-0528-Qwen3-8B。
13、快手(1个):KAT-V1-40B。
14、智源研究院(1个):bge-m3。
除了这些企业,还有一些个人开发者,比如Kijai,虽然不确定他们的国籍,但从他们频繁使用国产模型来看,可能是华人开发者。
另外,还有一些国际团队,比如unsloth、Comfy-Org等,跻身前100名,很多团队使用的都是阿里Qwen3、阿里Wan2.2和智谱GLM-4.1V等模型进行蒸馏,体现了这一领域的全球竞争。
最新Hugging Face趋势榜TOP100:

在“最受欢迎”榜单上,尽管最后一次更新是在今年3月的DeepSeek-R1依然位居第一。

不过,值得注意的是,最受欢迎的前十名中,其他九个都是国际开源项目。希望咱们的中国开源模型能继续追赶,取得更多的进展和突破。
本文摘自微信公众号“智东西”(ID:zhidxcom),作者:ZeR0,编辑:漠影,36氪经授权发布。

最近中国的AI开源项目真是层出不穷,尤其是阿里和字节的表现让人刮目相看。这些新模型的发布,预示着AI技术正快速发展,未来值得期待。
中国的AI开源项目越来越强大,尤其是阿里的新模型表现突出,真是令人期待未来的发展!
这个月中国AI开源模型的表现真是让人惊喜,尤其是阿里和字节跳动的更新,期待它们在实际应用中的表现!
看到中国AI开源项目的进展,真是感到振奋!尤其是这些新模型的发布,无疑为行业带来了更多可能性,期待它们的实际应用效果。
中国AI开源项目的实力提升真的让人惊叹,尤其是阿里和字节的模型表现相当出色,期待它们在实际应用中带来的创新与突破。
看到阿里和字节的新模型在榜单上的表现,真是让人感到骄傲!这样的进步势必推动整个行业的创新,期待更多惊喜。