文 | AI大模型工场,作者 | 参商 西梅汁,编辑 | 星奈


国内大模型发展趋势|6月份解读
高考季,AI展现实力
你可能注意到了,最近的高考季变成了各大AI公司展示技术的舞台。许多厂商都纷纷推出了志愿填报的功能,把考试与选择学校这两个重要环节紧密结合,也让市场的竞争格局发生了变化。这场关于高考的AI比拼,不仅是技术实力的较量,更是对教育痛点的精准回应。
夸克搜索站在了前面,推出了一个集成化的志愿填报平台。这个平台不仅提供了大量的大学和专业信息,还能根据考生的个人情况,利用AI模型进行智能推荐。通过自然语言处理技术,考生只需简单提问,就能迅速获得往年分数线、招生计划等关键信息,避免了填写志愿时的弯路。夸克的核心AI推荐系统,会基于考生成绩和兴趣,给出个性化的院校和专业建议。最新消息显示,夸克已经为考生和家长生成了超过1000万份专业级的志愿报告。
QQ浏览器也是这场竞争中的重要参与者。借助腾讯的社交生态,它不仅提供了实时填报的工具,还通过数据分析和机器学习为考生提供个性化的志愿建议。依托腾讯云的大数据能力,QQ浏览器能够深入挖掘往年的录取数据,提供更科学、更具参考价值的预测。内置的智能助手还可以随时解答考生在填报过程中的疑问,极大提升了用户体验。
百度也不甘示弱,推出了AI驱动的“高考志愿助手”。凭借强大的搜索和大数据基础,百度为考生打造了一个一站式的信息查询平台。在AI大模型的支持下,它能够综合考生成绩、兴趣以及就业前景等多维度数据,制定个性化的填报方案。同时,百度教育还与高校合作,提供特定学科和专业的深度解析,进一步提升了建议的精准度和参考价值。
大家都知道“七分考,三分报”,而如今这关键的“三分”可能会被算法重新定义。背后是厂商们对考生“志愿焦虑”的深刻洞察。当AI开始模拟人类专家的思考方式,志愿填报不仅仅是信息检索,而是变成了智能决策的辅助工具。更让人期待的是,这些在高考场景中锤炼出来的“思考型AI助手”,未来或许还会应用到求职、置业等更多重要的人生决策中。
资本趋向头部企业,IPO浪潮来袭
进入6月,AI行业的资本格局展现出明显的“马太效应”,资源迅速向技术壁垒高、商业化路径明确的头部企业汇聚。一方面,像银河通用和硅基流动这样的技术实力雄厚的公司,纷纷获得了巨额融资。银河通用成功吸引了11亿人民币的资金,而硅基流动则获得了阿里领投的数亿元融资。
这些企业的融资成功,反映出资本市场对技术领先企业的偏爱,资本更倾向于把资源集中在技术底蕴扎实、市场前景广阔的公司上。
与此同时,一些明星企业却面临收缩:阶跃星辰暂停了ToC产品线,百川智能转向医疗领域,零一万物则在艰难求生。“AI六小龙”中截至目前已有12位高管离职。这种市场分化凸显了资本对技术落地能力的严格筛选,同时,资源向能够深度结合场景的头部技术公司倾斜的趋势愈加明显。
与融资分化同步,AI企业的IPO进程明显加快,行业进入了密集的资本收割期。摩尔线程、云知声等公司纷纷启动IPO,MiniMax也确认了赴港筹备的计划。
随着技术日益成熟和市场需求的爆发,越来越多的AI企业开始考虑通过上市来获取更多资金,以加快发展步伐。尤其是在技术逐步成为竞争壁垒的背景下,资本的支持不仅为企业带来了更多资金,也增强了它们在行业中的竞争力。
总体来看,资本正在迅速向头部企业集中,融资和IPO的加速体现了行业的成熟与竞争的加剧。技术领先者和具有创新优势的企业,正成为资本市场的宠儿。而对于一些技术尚未成熟或市场前景不明朗的公司,生存压力则愈加沉重。
Agent技术在各场景的深入应用
Agent技术在教育、医疗、办公等多个领域的渗透越来越明显。
以夸克的AI高考志愿功能为例,它通过大数据分析和智能推荐,帮助学生根据自己的兴趣和优势做出更合适的志愿选择。这种应用不仅让AI在教育领域的重要性提升,也让它成为决策过程中的一种助力。
在医疗领域,蚂蚁的AI健康管家AQ和智谱的CoCo企业助手也展示了Agent技术的强大潜力。蚂蚁的健康管家围绕群众看病就医的刚需,AQ提供健康科普、就诊咨询、报告解读和健康档案等多项AI功能,并能高效连接全国超过5000家医院、近百万医生和近200个名医AI分身等专业医疗服务。
智谱的CoCo则通过AI优化企业的内部工作流程,提升了办公效率,减少了重复劳动,帮助企业节省了大量成本。可以看出,Agent正在这些高频、刚需的场景中找到了自己的位置,开始真正解决实际问题。
与此同时,大厂们也在努力降低Agent的开发和使用门槛。腾讯云的AI Builder平台让开发者可以迅速拼装出适合自己业务场景的智能体,并与微信生态无缝集成,实现“任务穿透”。钉钉在多维表免费开放后,结合20多个AI模板,为中小企业提供零代码的Agent接入能力;火山引擎的豆包大模型则通过MoE架构和端到端的工作流,将图片、语音转化为动态表格,加速Agent的应用,推动办公环境的智能化。
同时,搜索与研究型Agent的进化,也在推动信息获取方式从“检索”向“深度推理”转变。360 AI搜索的“慢思考模式”通过15步思维链和跨模型调用(如360智脑、豆包、通义千问),对复杂问题展开多轮反思与验证,提升答案的可信度。Kimi推出的Researcher工具则代表了Agent自主研究能力的突破,基于端到端强化学习技术,能够自动拆解问题、搜索数百篇资料,生成万字报告及可视化图表,实现“目标→执行→输出”的全自动化。
技术的不断进步,使得Agent正在快速渗透各行各业,成为推动行业数字化和智能化转型的重要力量。
国内主要大模型进展
字节跳动
字节跳动在AI领域的全新布局与突破
在6月,字节跳动以火山引擎春季FORCE原动力大会为契机,推出了一系列举措,包括新一代AI大模型的发布、AI应用生态的拓展以及内部AI工具的推广,进一步巩固了其市场地位。
6月11日,火山引擎春季FORCE原动力大会正式开启,会上推出了豆包大模型1.6,并宣布实施统一的定价策略。价格大幅下调,最低仅为2.6元每百万tokens,相比于豆包大模型1.5和DeepSeek-R1的7元每百万tokens,降低了整整63%。
与此同时,豆包大模型的使用量也实现了爆炸式增长。截至2025年5月底,豆包大模型的日均tokens使用量已突破16.4万亿,较去年5月发布时增长了惊人的137倍。
6月12日,FORCE原动力大会继续进行,推出了更多AI产品和工具,如PromptPilot、MCP Servers、TRAE等,并对扣子开发平台进行了升级。字节跳动的技术副总裁洪定坤透露,TRAE的月活跃用户已超过100万。
6月16日,有消息称字节跳动的人工智能实验室(AI Lab)负责人李航已正式辞任,身份变更为“劳务/顾问”。不过,字节的相关负责人表示“李航辞任”其实是误传,实际上是退休后返聘,管理范围没有变化。
6月17日,发生了多项重要动态。首先,SSeed团队推出了基于多模态模型的AI视频生成工具Seedance1.0。其次,字节跳动宣布与比亚迪建立深度合作,双方将共同建立实验室,利用SSeed团队开发的电解液AI模型框架BAMBOO,帮助比亚迪加速兆瓦闪充电池的研发。同一天,字节旗下的豆包上线了“AI播客”新功能,用户只需上传文档或输入文章链接,即可一键生成AI双人对话的播客音频。
6月23日,字节跳动的抖音正式推出了一款名为”探饭”的AI美食助手。这款工具集合了探店推荐、菜品筛选和美食攻略等功能,用户可以使用地图找店、比价和AI点菜等特色服务。该产品基于豆包大模型,由字节跳动的全资子公司北京有竹居网络技术有限公司开发。
6月24日,火山引擎正式推出企业A中台HiAgent2.0,引入Agent DevOps理念,将开发、运营和测试等环节紧密结合,通过自动化流程和工具链的整合,实现智能体从开发到运维的高效交付。
总的来看,字节跳动正在通过技术普惠、产品多样化和生态开放的三重策略,加速AI技术在基础设施、消费端和产业端的价值渗透。
阿里巴巴的AI战略布局
在6月,阿里巴巴围绕AI技术展开了密集的布局,涵盖开发工具、行业应用、全球化部署及人才战略等多个维度。
6月9日,通义千问3在开源一个月后,全球下载量突破1250万次,衍生模型超过13万个,覆盖Hugging Face和魔搭社区等平台,其30B参数版本在代码生成任务中的响应速度达到了每秒18个token。
同日,硅基流动完成了数亿元人民币的A轮融资,阿里云领投,老股东创新工场等机构也进行了超额跟投,华兴资本担任独家财务顾问。
6月6日,通义实验室发布了Qwen3 Embedding系列模型,包含0.6B、4B和8B三种规格,8B版本在MTEB多语言榜单中登顶,性能超越GPT-4等商业API。该模型支持网页检索和RAG等场景,在长文本语义理解任务中的误差率降低至2.3%。
在6月初,钉钉7.7.0版本推出了多维表全免费的策略,并推出了20多个AI智能字段模板,涵盖图像生成和文本解析等功能。其闪记功能针对招聘面试和客户洽谈等场景进行了优化,实现实时语音转写和智能纪要生成,企业用户反馈会议效率提升超过40%。同期,夸克发布了“深度研究”功能,支持一键生成专业研报,这项基于AI的智能分析研究功能旨在将原本需要几天到几个月才能完成的专业研究任务缩短至几分钟内,并生成结构化、专业的内容报告。
6月27日,《时代》杂志发布了“全球百大影响力企业榜单”,阿里巴巴再次入选,并被评为“开源AI领域的领军者”。这是阿里巴巴自2021年入榜以来的第二次上榜。
在人才与生态建设方面,阿里巴巴6月8日启动的2026届校招中,AI相关岗位占比近50%,涵盖大模型训练和多模态算法等方向。
这一系列动作表明阿里巴巴正加速构建“基础模型-工具链-行业应用”的AI闭环:通过开源模型Qwen3扩展技术影响力,借助IDE与开发框架降低应用门槛,并以行业垂直方案拓展商业化边界(如高考志愿和企业服务)。财报数据显示,阿里云AI相关收入连续三个季度同比增速超过60%,技术红利正在转化为商业增长动能。
华为的AI技术创新与开源
6月30日,华为宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B)。此外,基于昇腾的模型推理技术也同步开源,华为表示此举是践行昇腾生态战略的重要一步,将推动大模型技术的研究与创新,加速人工智能在各行各业的应用与价值创造。
据了解,华为最新开源的Pro MoE 72B大模型在参数量为720亿、激活160亿参数的情况下,通过动态激活专家网络的设计,展现了优异的性能,甚至可与千亿级模型相媲美。在业界权威大模型排行榜Super CLUE最新公布的榜单中,华为的表现居于国内第一。
6月20日,在华为开发者大会上,华为全面分享了HarmonyOS、昇腾AI云服务和盘古大模型等最新科技成果,并宣布盘古大模型5.5正式发布,涵盖自然语言处理、计算机视觉、多模态、预测和科学计算等多个领域的基础模型全面升级。
此外,华为诺亚方舟实验室主任王云鹤和华为云CTO张宇昕分别就盘古基础大模型技术及华为云如何用AI重塑云服务进行了主题演讲,深入解读华为在AI领域的全栈创新优势。
DeepSeek的模型升级
DeepSeek在6月初发布了DeepSeek-R1模型的小版本升级,版本号为DeepSeek-R1-0528。此次升级基于DeepSeek V3 Base模型,显著提高了模型的推理能力、编程性能、长文本处理能力和写作质量。在AIME 2025测试中,该模型的准确率从旧版的70%提升至87.5%,幻觉率降低了45%-50%,整体性能接近国际顶尖模型(如OpenAI的o3和谷歌的Gemini 2.5-Pro)。
百度的智能云与AI技术战略
百度近期围绕智能云业务和AI技术进行了一系列战略调整及产品发布。
6月30日,百度正式开源文心大模型4.5系列,涵盖47B和3B激活参数的混合专家模型以及0.3B参数的稠密型模型等10款模型,实现预训练权重和推理代码的完全开源。
目前,文心大模型4.5开源系列已可在飞桨星河社区和HuggingFace等平台下载部署,同时开源模型API服务也可在百度智能云千帆大模型平台使用。早在今年2月,百度就已预告文心大模型4.5系列的推出计划,并明确将在6月30日正式开源。
6月23日,百度举行了AI开放日,副总裁陈洋现场发布了文心快码独立AI原生开发环境工具——Comate AI IDE。这是行业首个多模态、多智能体协同的AI集成开发环境,目前已接入文心4.0 X1 Turbo,开箱即用。
6月10日,百度文库与网盘联合举办的AI Day开放日活动中,发布了主打“拍存管一体”的“AI相机”功能。副总裁、文库/网盘事业部负责人王颖在现场分享中提到,用户可以通过百度文库App、网盘App以及网页不同入口进入AI相机。
作为全模态输入的重要能力,AI相机已在百度网盘APP上线,并接入百度文库APP。百度文库还宣布多智能体协作能力“GenFlow超能搭子”全新升级为2.0版本,使其成为率先实现全场景满足、全链路覆盖的多智能体协作应用。
6月9日,百度智能云正式推出金融领域专属大模型“千帆慧金”及行业智能体解决方案矩阵。该产品基于数百亿金融场景tokens训练,在同等参数规模下效能指标提升25%至30%,主要应用于金融机构的精准高效AI解决方案。
6月4日,百度进行了一轮组织调整和干部轮岗,原业务中台负责人袁佛玉被调至前线,负责泛科技、金融、能源等领域,而政务、交通、汽车等领域则由石清华负责。
自2011年以来,百度已实施干部轮岗制度,通过引入OKR绩效管理制度、调整To B组织架构和倡导干部年轻化等方式,每两三年组织干部轮岗,以适应市场变化。
根据百度刚刚发布的Q1财报,智能云业务表现强劲,增长达42%。从大模型相关项目的招标市场数据来看,百度智能云在行业中处于领先地位,一季度中标数量和金额均位列第一。
通过干部轮岗保持组织的敏捷性,借助大模型技术突破推动垂直场景的落地,并以开发者工具生态降低AI应用门槛。财报数据与市场表现印证了其战略的有效性,而在金融、办公和开发工具等领域的密集创新,或将成为百度智能云持续领跑行业的重要驱动力。
腾讯的混元大模型升级
6月,腾讯围绕自研大模型“混元”展开了一系列技术升级和产品发布。月初,混元大模型矩阵进一步迭代,推出了深度思考模型混元T1和快思考模型Turbo S。其中,Turbo S在权威评测平台Chatbot Arena的排名已上升至全球前八,代码与数学能力进入全球前十,理科推理和代码生成等核心指标较之前提升超过10%-39%。
6月27日,腾讯正式发布并开源混元大模型家族的新成员——混元-A13B模型。该模型采用基于专家混合架构,总参数规模达到800亿,激活参数为130亿,在效果上与顶尖开源模型相当,同时显著降低推理延迟和计算开销,为个人开发者和中小企业提供了更具性价比的AI解决方案。
据腾讯方面介绍,混元-A13B模型在极端条件下仅需一张中低端GPU卡即可部署,用户可以通过Github和HuggingFace等技术社区下载使用,模型API也已在腾讯云官网上线。
同一天,搜狗输入法版推出了“AI合成表情”和“候选表情”两大功能,以AI技术提升用户的社交沟通体验。
AI技术的全新进展,让生活更智能
腾讯最近推出了一项酷炫的“AI合成表情”功能,利用他们的混元大模型,用户只需输入文字或者表情,就能在瞬间生成个性化的表情包。还有“候选表情”功能,输入一些常用语时,系统会自动推荐相关的表情包,发信息时再也不用费力去找了,直接一键发送就行。
在6月16日,腾讯云也不甘示弱,推出了一个名为“AI Builder”的应用开发平台。这款工具让用户通过自然语言描述需求,可以迅速生成完整的前后端代码,想修改也不成问题,轻轻松松一键部署就搞定。
AI Builder推出后,腾讯强调这平台在开发者生态系统中的重要性。它不仅能够生成完整应用,还允许开发者导出代码包进行深度调整,满足专业开发者的个性化需求,这可是吸引了不少开发者的眼球哦。
而在6月下旬发布的财报中,腾讯明确表示AI将是他们未来增长的关键。数据显示,腾讯的AI技术在广告、游戏和云业务中发挥了重要作用,广告业务同比增长了20%,游戏收入更是上涨了24%。此外,腾讯的混元大模型已经应用于700多个内部场景,广泛服务于微信、QQ和腾讯文档等产品,极大提升了运营效率。
在6月14日的CVPR 2025大会上,腾讯还首次将混元3D 2.1大模型全链路开源,开发者们可以不仅调用模型,还能深入了解其训练过程和设计原理,甚至可以根据自己需求进行二次训练或微调。
而在6月8日,微信生态中的公众号后台也接入了首个AI助手“腾讯元器”,这让公众号运营者能够用AI工具进行问答式的互动,比如自动解析文章、总结热点事件、回答用户咨询等,大大提高了运营效率。
科大讯飞的创新步伐
6月26日,科大讯飞的语音合成技术迎来了全新升级,实现了一句话声音复刻和超拟人合成的重大突破。据评测数据显示,这项技术在声音相似度和准确度方面都处于行业领先水平。
这次的技术升级基于星火语音大模型,构建了一套层次化的语音建模框架,经过音色编码增强和强化学习等技术突破,音色恢复的相似度得到了显著提升,能够精准还原用户的停顿习惯、情感变化和呼吸节奏,让生成的声音几乎和真人无异,应用门槛也因此大大降低;而超拟人合成技术则让AI的声音具备了情感智慧。
随着星火语音大模型在教育、医疗、汽车、金融等领域的深入应用,已经为全国5万多所学校、600家医院和众多金融机构提供服务。
在6月12日,科大讯飞在深圳举办了2025智能交互产品升级发布会,主题为“交互领航 智启新章”,此次重磅升级了AIUI、机器人超脑、虚拟数字人和星辰开发平台等四大核心产品,推动人机交互从“工具型”向“类人化”转变。新一代AIUI以大模型为引擎,达成了情绪识别、创意生成和深度语义理解,日均交互量已突破3亿次。
6月10日,科大讯飞还宣布星火 X1认知大模型将于今年7月迎来架构级更新,预计会在现有基础上做更深入的优化和功能拓展,进一步提升智能应用能力。董事长刘庆峰表示,升级版将更好地满足用户对人工智能的期待,特别是在教育和专业领域的应用。
在高考科目表现上,讯飞星火 X1也展现了显著的进步,尤其在数学、代码、逻辑推理、文本生成、语言理解和知识问答等方面。今年4月20日,星火 X1在完成这些通用任务时,其模型参数比业界同类产品少一个数量级,但整体性能却与OpenAI的o1和DeepSeek的R1相当。
科大讯飞始终遵循“自主可控、通专结合、软硬一体、行业深耕”的战略,持续推动AI技术在各行各业的深入应用。
360的创新动态
6月11日,360正式推出了“纳米AI超级搜索智能体”。据360集团创始人周鸿祎介绍,这个超级搜索智能体能够打破各个平台的信息壁垒,让AI直接调用小红书、淘宝、京东、高德地图等信息。他强调,尽管大模型的能力越来越强,但单靠大模型是不够的,大模型就像大脑,能思考、生成,但没有手脚,无法实际操作。
周鸿祎还推出了可以接入个人知识库的AI智能录音硬件纳米AI Note,以及与Rokid联名的AI眼镜。
6月14日,360AI云盘同步版进行了更新,原名为360云盘同步版,这是一款自动同步工具,用户只需将文件拖入本地360AI云盘文件夹即可实现自动同步,方便快捷,无需U盘,轻松实现数据存储。
360AI云盘同步版是360推出的全新网络存储应用,用户的照片、文档、音乐、视频等各种内容都能随时随地访问,永不丢失。
6月20日,360 AI办公工具集进行了版本更新,更新为3.1.0.2200,大小为26.46 MB。这是一款一站式AI办公工具集,涵盖AI图片、AI文档、AI写作、AI音视频、AI PPT、PDF处理等200种办公权益及30万模板资源,让用户高效工作,轻松生活。
6月22日,360AI图片工具也进行了更新,已经从360看图升级而来。这款看图工具集简洁、高效、安全于一体,适合专业摄影师和普通用户使用。
智谱的智能助手
6月9日,智谱AI宣布全新企业级超级助手Agent CoCo正式上线,这款智能助手以“懂你懂企业,能干能交付”为核心理念,致力于提升企业的工作效率。
CoCo的最大亮点在于其创新的记忆机制。与传统AI助手不同,CoCo可以记住每位员工的工作习惯和偏好,针对不同部门提供差异化服务,持续学习并优化互动体验,主动提供个性化的信息和建议。
在6月4日,智谱AI迎来了一项重要人事变动,首席运营官(COO)张帆将于6月底离职,选择在AI Agent领域继续创业。对此,张帆向界面新闻确认,近期将从智谱离职,创业方向为企业级生产力Agent。
昆仑万维的技术发布
6月20日,昆仑万维正式发布并开源Skywork-SWE-32B,揭示了LLM软件工程能力的数据缩放定律。
Skywork-SWE-32B模型在SWE-bench Verified基准上取得了38.0%的pass@1准确率,刷新了Qwen2.5-Coder-32B系列模型在OpenHands代码框架下的最佳成绩。引入测试时扩展技术后,模型表现提升至47.0%的准确率,不仅超越了现有参数规模在32B以下的开源模型,也显著缩小了与闭源模型之间的性能差距。
灵感岛的战略合作
最近两个月,天下秀旗下的“灵感岛”AI营销平台持续加强技术布局与行业渗透,积极推动AI与营销的深度融合。6月27日,荣联科技集团与灵感岛达成战略合作,发布了针对汽车行业的AI营销解决方案,提供智能一体化服务,推动AI技术在汽车全产业链的深度融合应用。这次合作旨在通过技术创新帮助车企升级,提升营销效率和智能化水平。
上个月,灵感岛AI业务在海外首站布局,东京开幕了“灵感岛AI创新孵化中心”,这是天下秀首个专业AI创新孵化平台。天下秀的董事长李檬表示:“在东京设立孵化中心,是我们面向海外AI布局的第一步,也是全球市场技术出海战略的重要一步,未来将以灵感岛AI为核心进行创新孵化合作,构建国际化内容创作生态体系。”
据了解,灵感岛还提出了国内首个GEO技术方法论体系——STREAM,通过语义结构化处理、可信源认证、用户共鸣等技术框架,针对性解决“AI幻觉”问题,为品牌可信认知提供系统性方案。
凭借十余年的红人营销数据与实战经验,天下秀推出了“灵感岛”,以“创作者赋能+企业营销服务”的双引擎模式,解决AI内容的精准度、可信度和传播效能问题,企业端构建了“创意灵感-素材生成-矩阵分发-效果追踪”的全链路闭环,支持图文/短视频的批量生成、爆款复刻、社媒账号管理以及数字人IP打造,已为本地生活、汽车等行业客户带来获客增长;创作者端则推出了涵盖热点挖掘至脚本生成全流程的6大AI智能助手,推动AI技术向产业实践转化。
快手的音效功能
6月27日,可灵AI推出全系列视频模型,新增“视频音效”功能,能够在生成视频时同步生成高质量的立体声音效,实现“所见即所听”的沉浸式体验。同时,平台原有的“音效生成”功能中也更新了“视频生音效”模块,支持用户上传视频或调用历史作品,一键匹配精准同步的音效。
这一功能基于可灵自研的多模态视频生音效模型Kling-Foley,能够对音画进行帧级对齐,展现了极高的音画同步精度和出色的空间听感。目前,新功能已向用户限时免费开放。
6月17日,快手的股价早盘上涨了3.39%,报收50.35港元,这一股价波动与可灵AI在4月15日发布的可灵2.0和可图2.0模型的公告息息相关。
6月1日,快手自研的视觉生成大模型——可灵AI V1.6正式开放API,这一版本在生成质量和内容效果上都有显著提升,特别是在广告视频素材生成方面表现优异,能够精准响应复杂的文字描述,包括运动、时序类动作和镜头运用等复杂需求。
MiniMax的技术突破
作为上海AI领域的独角兽企业,MiniMax在6月以“技术发布周”为主题,密集推出了一系列技术创新,在基座模型、多模态技术和智能体应用层面实现了全面突破。6月17日,MiniMax推出了自主研发的MiniMax-M1系列模型,这被称为全球首个开源大规模混合架构推理模型,核心创新在于引入了“闪电注意力”(Lightning Attention)混合架构和创新的CISPO强化学习算法,旨在大幅提升大规模语言模型的推理效率和经济性。
MiniMax与月之暗面:AI领域的最新动态
就在M1发布后不久,6月18日,MiniMax推出了他们的新一代视频生成模型Hailuo-02,这一发布无疑在多模态技术领域引起了轰动。这款Hailuo-02采用了最新的“噪声感知计算重分配(NCR)”架构,不仅将模型参数和训练数据量分别增加了3倍和4倍,而且效率也提升了2.5倍,真是让人惊叹。
与此同时,AI独角兽稀宇科技(MiniMax)正在考虑在香港进行首次公开募股(IPO)。根据内部人士透露,虽然相关计划已经在酝酿中,但目前仍处在初步阶段,具体情况还得再观察。
到6月19日,MiniMax还推出了他们的新产品——MiniMax Agent。这款智能体在处理长时间复杂任务上取得了显著突破,可以说它就像一个靠谱的队友,能够大大提升生产力。根据内部测试,MiniMax Agent已经能够在网页开发、深度调研等专业领域,替代一位专业人士的工作量,持续一周之久。
继续推进创新,6月21日,MiniMax又推出了音色设计产品Voice Design,进一步丰富了他们的多模态AI产品线。这个新产品专注于声音特性定制和生成,为AI音频内容创作提供了强有力的工具。
经过这一系列密集的技术发布,MiniMax对外表示,这不仅是公司技术实力的集中展示,也为当前全球AI竞争带来了新的变数,确实在行业发展路径上注入了新的活力。
月之暗面发布新模型
在6月17日,月之暗面推出了首款专注于软件工程任务的开源代码大模型Kimi-Dev-72B,基于720亿参数的Qwen2.5-72B进行训练,利用大规模强化学习方式进行优化,在SWE-bench Verified基准上取得了60.4%的准确率,超过了DeepSeek等其他模型。而且,6月20日晚,他们发布了首个智能体,开始小范围内测Kimi-Researcher(深度研究)。
这个智能体被称为“全球首个基于端到端自主强化学习的深度研究智能体”,其创新之处在于采用了全新的“零结构设计”和“自主决策机制”,完全依靠自己的决策能力在动态环境中运行。
过去,智能体技术主要由OpenAI、Anthropic等国际公司掌握,而月之暗面的突破让中国企业在这一前沿领域占据了重要位置。
阶跃星辰的人事变动
6月12日,阶跃星辰的技术专家段楠宣布离职,加入京东探索研究院,负责视觉与多模态实验室。他曾在阶跃星辰担任视频生成模型负责人,后来以Tech Fellow的身份出现。他的加入标志着京东在人工智能领域吸纳了又一位重要的技术人才。
此外,阶跃星辰在去年底对其角色扮演类agent产品“冒泡鸭”停止了大规模投入,原团队合并至对话产品“跃问”(现名“阶跃AI”),仅保留少部分员工进行运维。这些调整显示出阶跃星辰正在调整战略,回归核心技术竞争力的打造。
云知声的上市计划
6月30日,云知声智能科技股份有限公司(以下简称“云知声”)在香港联合交易所主板挂牌上市,股份代号为09678.HK。
云知声成立于2012年,2015年开始自研芯片,2018年推出边缘交互式AI芯片UniOne系列,如今技术栈已经形成了由Atlas AI基础设施、云知大脑和AI应用解决方案构成的完整体系。根据他们的招股书,2022年云知声已经提供了1300万颗消费级AI芯片,并通过NPUIP授权实现了车用芯片的商业化。
在上市前,云知声完成了11轮融资,2023年获得了7亿元的D3轮融资,估值约为90亿元。招股书显示,云知声的股东包括京东、360、高通、启明创投和中网投等,此次上市还引入了商汤科技作为基石投资者。
云知声将在6月20日开启招股,直到25日结束,计划于2025年6月30日正式在港交所上市,成为“港股AGI第一股”。此次IPO计划发行1,560,980股H股,包括156,100股H股的香港公开发售和1,404,880股的国际发售。按照每股165港元至205港元的招股区间计算,云知声将通过本次发行最多募集3.2亿港元,其IPO市值预计在117亿港元至145亿港元之间。
值得注意的是,云知声此次共引入3名基石投资者,累计认购约9550万港元,其中商汤认购约4370万港元,臻一资管认购3000万港元,润建股份(002929.SZ)认购2000万元人民币。
