李彦宏在百度世界2024大会上提到,AI被誉为产业革命的机遇,是因为它能无限扩展社会经济的生产力。他在台上还为开发者们分享了两种“神兵利器”。
11月12日,百度世界2024在上海隆重召开,这次大会不仅展示了百度在AI技术领域的创新和应用进展,还深入讨论了AI时代的前沿思潮。期间,百度推出了两项赋能应用的新技术:增强检索的文生图技术(iRAG)以及无代码工具“秒哒”。
这次大会以“应用来了”为主题,目的是展示AI应用的快速发展,也希望通过技术为未来的AI应用描绘出新的蓝图。李彦宏表示,“百度不打算推出一个所谓的‘超级应用’,而是要协助更多人和企业创造出数百万个‘超级实用’的应用”。
其实早在一年前,李彦宏就提到过:“在AI原生时代,我们需要大量的AI原生应用,而不是仅仅依赖几个大型模型。”
而当务之急就是要解决“AI应用如何产生”的问题。
一年前,他提出了这个问题,而今天,他带来了答案。
“秒哒”无代码:让AI应用开发迎来“群星闪耀”的时代
在2024年百度世界大会上,最让人印象深刻的发布毫无疑问就是“秒哒”。
对于非专业人士来说,传统的应用开发过程依然很复杂,许多创新的想法因为技术门槛而止步不前。为了解决这个问题,百度推出了“秒哒”无代码工具,旨在让每个人都能轻松创建自己的应用。
根据官方介绍,“秒哒”拥有三大核心特点:
1. 无代码编程:大模型直接生成代码,无需手动编写;
2. 多智能体协作:利用文心大模型的思考能力,协调不同智能体的工作;
3. 多工具调用:通过文心大模型的能力,可调用网页检索、iRAG、地图API等多种工具。
凭借无代码编程、多智能体协作和多工具调用这三大特性,用户只需通过自然语言指令就能完成应用的创建。
现场,李彦宏以萝卜快跑的新技术发布会为例,演示了如何通过几句话,0号智能体迅速给1到4号智能体分工,分配了策划、小编、程序员和质检员的任务。只需3分钟,这个“智能体团队”就完成了一个简单的发布会邀请系统。观众们对这样的高效表现纷纷赞叹不已。
“秒哒”的上线意味着,任何人都可以像程序员一样,只需会说话就能开发应用,这大大降低了AI应用开发的门槛。这样的创新拓宽了AI应用开发的边界,个人无需依赖庞大的开发团队,就能独立指挥多个智能体协作,实现“一人团队”。
技术的零门槛将进一步加速智能体的普及。“秒哒”将帮助更多人和企业打造出数百万个“超级实用”的应用。
显然,技术零门槛将加速智能体的崛起,助力个人和企业创造出数百万个“超级实用”的应用,从而给各行各业带来前所未有的变革。目前,文心智能体平台已经吸引了15万家企业和80万开发者加入,覆盖了多种应用场景。未来,“秒哒”将打通多智能体协作的链路,让创造力真正转化为生产力。
这意味着,“秒哒”不仅是一个无代码开发平台,还是一个将创意变为现实的工具。只要你有想法,就可以用“秒哒”把它实现,“只靠想法就能赚钱”的梦想或许不再遥不可及。
李彦宏表示,“秒哒”是“人类历史上最复杂的多智能体协作工具”。这种创新的协作方式让AI应用开发变得更高效,同时也带来了前所未有的灵活性,成为用户日常工作的得力助手。
如今,全球各大科技公司都在关注智能体,但像百度这样将智能体作为战略重心的并不多。李彦宏认为,智能体是AI应用的主流形态,正迎来爆发期,它将成为AI原生时代内容、信息和服务的新载体。
回顾2021年百度在港股上市时,李彦宏重申:“我们的信念从未改变,我们坚信技术能够改变世界。我们有决心和耐心,能够承受孤独,也能拥抱未来。”
展望未来,随着2025年第一季度“秒哒”的正式上线,李彦宏所说的“AI应用的群星闪耀时刻”或许真的不远了。
文心iRAG——百度对技术价值的坚持
在百度世界2024大会上,另一项重要发布——文心iRAG,展示了百度在技术价值上的独特坚持。
在AI技术发展中,可靠性至关重要。李彦宏指出,如果大模型总是“胡说八道”,就无法赢得人们的信任,更谈不上实际应用。因此,攻克大模型的幻觉问题,成为了AI发展的一个关键挑战。
为此,百度提出了检索增强(RAG),并研发了“理解-检索-生成”的大模型检索增强技术架构,联合优化搜索和大模型,显著提升了大模型的效果。
作为以搜索起家的百度,逐渐在行业内形成共识,各大企业纷纷开始尝试利用RAG来优化自己的模型。
在过去24个月的大模型热潮中,行业最大的变化是大模型基本消除了幻觉。如今,文字层面的检索增强生成(RAG)技术取得了显著成效,但在图像等多模态内容与RAG的结合上仍需加强。
那么,在RAG领域的下一步该如何迈进呢?行业内却出现了变数。今年2月,OpenAI推出了Sora视频生成模型,这一新技术思潮既是机遇也是挑战,考验着企业对技术投入的“定力”。许多模型企业似乎看到了未来的方向,纷纷转向研究视频大模型。而百度则选择继续攻克多模态的“幻觉”问题,虽然看似简单枯燥,但只有解决了这个难题,多模态模型的产业应用才能真正实现规模化。因此,今天我们看到了文心的检索增强文生图技术iRAG的发布。
传统的AI图像生成在特定场景下常常会出现认知错误,比如在生成历史人物或标志性建筑时,AI可能会出现物体拼接错位或细节模糊等问题,严重影响内容的真实感。
提示词:帮我画一张马斯克和孙悟空一起参观水族馆的图
而iRAG通过将百度搜索的海量图片资源与文心大模型的生成能力结合,利用“理解-检索-生成”的三步流程,先理解用户的图像需求,再通过多模态协同检索出最符合需求的素材,使得AI生成的图像在精准度和细节还原度上达到了前所未有的水平。这一创新大幅提升了AI生成图像的真实性,使得生成的内容接近于照片效果,消除了幻觉问题带来的不信任感。
以提示词“画一张正在玩手机的包青天”为例,大模型之家使用搭载文心iRAG的文心一言进行图片生成,可以看到文心一言生成的包公,黑色的面容下显得威严,展现了他铁面无私、公正刚直的形象,在衣服和皮肤质感上也更加真实。相比之下,DALL·E生成的包公却呈现出一张外国面孔,与角色设定相差甚远,显然对于中华文化的把握还有待提升。
再来看提示词“生成一张比萨斜塔和自由女神像同框出现的图”,搭载文心iRAG的文心一言(左)生成的图像中,石砖纹理、光影效果以及游人参观等细节表现得淋漓尽致,更重要的是,比萨斜塔和自由女神像被自然地置于同一地平线,形成了和谐统一的视觉效果,而DALL·E(右)生成的图像则显得简单粗糙,缺乏细致的呈现。
消除多模态模型幻觉不仅是技术的突破,更为AI生成内容的实际应用铺平了道路。在当前AI产业快速发展的背景下,iRAG为众多应用提供了更加真实可靠的图像生成方式,彻底改变了传统AI生成内容的局限性。
李彦宏用四个词总结了文心iRAG的价值:“无幻觉、超真实、没成本、立等可取”。iRAG为品牌推广和创意制作带来了巨大的商业价值。过去制作一组广告海报可能需要几万元,而现在借助iRAG,这种图像生成几乎可以零成本完成。
或许正是这种追求技术的纯粹,让百度能够冷静地在同行纷纷追随Sora时,选择“死磕”AI行业最顽固的痛点,才有了今天文心iRAG的惊艳亮相。
作为中国人工智能的先锋,百度不仅要与谷歌、OpenAI等国际巨头一较高下,还得发挥自身优势,让AI技术惠及更多人。
百度确实在全力以赴,通过像iRAG和“秒哒”这样的AI工具,吸引更多用户参与到智能变革中来。

截至11月初,百度文心大模型的日均调用量已经超过了15亿次,相比于5月的2亿次,增长了7.5倍,而一年前的5000万次更是飞升了约30倍。这样的急剧增长,正是过去18个月中国大模型应用迅猛发展的缩影。大模型技术的普遍应用,正在彻底改变各行各业的生产模式和商业运作。
李彦宏曾表示:“百度不是要造一个‘超级应用’,而是要帮助更多的人和企业创造出数百万个‘超级实用’的应用。”这一理念不仅显示了百度对AI技术的深刻洞察,也展现了其在全球人工智能产业中的战略定位。
写在最后

在发布会上,有个细节很有意思,李彦宏在展示智能工具“自由画布”时,特别提到这款能激发人们无限灵感和创造力的工具,“不是期货,而是随时可用的现货”,说话间流露出一丝兴奋。这份兴奋,应该源自于我们梦想中的世界,正在通过AI应用逐渐实现。
而在百度世界2024的AI应用小镇中,我们看到大模型之家展出了数百个大模型应用,其中很多已经深入到家庭、工厂和农田……无处不在地影响着我们的生活。
其实,只要仔细观察,就会发现,AI应用的时代,真的已经来临。











听说“秒哒”能快速生成应用,那是不是以后新项目启动的速度会大大提升呢?
李彦宏的演讲真是太激动人心了,感觉未来的应用开发会变得更简单。
希望“秒哒”能够在实际使用中表现出色,尤其是在用户体验方面不要掉链子。
文生图技术(iRAG)听起来很酷,真的能改善搜索体验吗?
无代码开发可能让很多人一夜成名,竞争会不会变得更激烈?
无代码的理念很吸引人,任何人都能开发应用,那如何防范滥用或不当使用呢?