从上周三开始,科技圈真是热闹非凡,前沿的AI技术接连登上新闻头条。你知道吗?OpenAI推出了GPT-4,微软也推出了带有AI助手的Microsoft 365 Copilot,而Midjourney则发布了能够“画手指”的V5版本,简直是AI工具一片繁荣的景象。但更令人惊讶的是,就在短短一天内,多家IT巨头几乎同时间推出了各自的新AI工具,媒体把这一现象称为AI界的“最卷一夜”。
根据各大媒体的报道,这些新工具涵盖了图像和视频的编辑与生成,有些还像GPT一样是大型语言模型,还有些则是为这些应用提供基础的硬件。对普通人来说,相关的报道里满是专业术语,所以上游新闻进行了整理,力求用更简单明了的方式呈现这一切。
Adobe:
发布了后期处理和创意生成AI
最早的时候,Runway是Adobe出的一个后期辅助工具,虽然借助了AI技术,但功能其实不算复杂:比如擦除物体、图像插帧、背景删除和运动追踪等。然而,当Runway打开了人工智能的新大门后,它的能力简直可以说是点石成金。
去年9月,Runway发布了Gen1版本,如今半年过去,Gen2版本终于来了。与Gen1相比,新版在画面连接上更流畅,画质也更高清了。现在的Gen2版本已经能达到“可看”的水平,虽然还不能说精致,但未来的可能性让人期待。
此外,环球网还有报道,Adobe最近推出了一款名为“萤火虫”(Firefly)的创意生成AI,可以通过文字生成各种图像内容。

据悉,Firefly将允许内容创作者通过自己的文字生成图像、音频、插图、视频和3D图像。Adobe数字媒体业务的总裁大卫·瓦德瓦尼在一份声明中表示:“通过Firefly,Adobe将把生成式人工智能的‘创意成分’直接融入客户的工作流程,帮助所有创作者提升生产力和创意信心。”
Adobe方面透露,目前Firefly已经在Adobe的企业级创意工具Adobe Express中进行内测,未来将扩展到Photoshop、Illustrator和Premiere等工具中。
Google Bard:
特别强调这只是实验
在大家刚被GPT-4和Midjourney V5惊艳了一周后,Google宣布正式开放Bard的访问:欢迎大家试用Bard,别忘了给反馈哦。
根据Google的最新演示,Bard更像是一个专注于学习和工作的随身助手,能够帮助你激发灵感,满足好奇心。你可以问Bard一些技巧,比如怎么在一年内读20本书,或者用简单的语言解释量子物理。

或许是受到ChatGPT和Bing Chat的负面消息影响,Google一直在强调Bard只是一个实验,Bard所生成的信息并不代表Google的观点。
借鉴Bing Chat的教训,Bard的第一个测试版限制了同一对话中的交流次数,以确保内容的准确性。当你第一次使用Bard时,它会提醒你这只是个实验,并期待你的反馈。
Bing Chat:
将人工智能融入浏览器
微软为新Bing和Edge浏览器的预览版更新了三项新功能:Bing Image Creator、AI驱动的故事和Knowledge Cards 2.0。其中,最引人注目的就是可以画画的Bing Image Creator。
Bing Image Creator的上线,让Edge浏览器成为第一个集成AI图像生成器的浏览器。AI驱动的故事和Knowledge Cards 2.0则让你在搜索后能看到图像、短视频以及AI生成的信息图表,帮助你快速获取事实和关键信息。
英伟达:
为大规模部署语言模型提供硬件支持
据澎湃新闻报道,当地时间3月21日,英伟达的首席执行官黄仁勋将OpenAI的ChatGPT称为人工智能的“iPhone时刻”,并在公司的春季GTC大会上宣布推出了专为其设计的推理GPU(图形处理器)——带有双GPU NVLink的H100 NVL。
英伟达推出新一代AI工具,助力大规模应用
最近,英伟达的CEO黄仁勋在公司春季GTC大会上表示,OpenAI的ChatGPT就像人工智能领域的“iPhone时刻”。他还介绍了新的H100 NVL推理GPU,这款图形处理器搭载了四对H100和双GPU NVLink,速度相比之前用于GPT-3的HGX A100快了整整十倍,简直是“核弹级”的选择,特别适合像ChatGPT这样的语言模型大规模应用。
此外,英伟达还推出了全新的云服务和代工厂NVIDIA AI Foundations,提供语音、视觉和生物模型的构建服务。
其中,NeMo是一个很棒的工具,可以用来创建定制的文本生成模型。而Picasso则是视觉语言模型的构建平台,能实现文生图、文本转视频、文本转3D等功能,帮助用户快速生成符合需求的视觉内容。只需通过API向Picasso发送文本提示和元数据,它就会利用DGX Cloud上的模型把生成的内容返回给你。如果把这些素材导入NVIDIA Omniverse,便能轻松打造出逼真的元宇宙应用和数字仿真。
BioNeMo是专为生命科学服务而设计的,提供AI模型的训练与推理,能大大加速药物研发中最耗时的环节,还能促进新蛋白质和治疗方案的开发,以及基因组学、化学和生物研究。
这些服务都可以直接在浏览器中使用,或者通过API调用,运行在NVIDIA的DGX Cloud上。英伟达甚至把“ChatGPT同款”的体验搬到了云端,向大家开放。为了让更多用户能负担得起使用大模型的成本,他们推出了DXG Cloud服务,月费仅从36999美元起,就可以拥有一个由8张H100或A100显卡构成的超级计算机,轻松应对高负载的计算任务。
新闻多一点>>
近期关于AI工具的热点事件
今年3月15日,OpenAI发布了功能更加强大的GPT-4版本。这款新模型不仅支持文字输入,还能处理图像输入,甚至可以混合使用文字和图像。
接着在3月16日,微软宣布将人工智能技术整合进其办公软件,命名为Microsoft 365 Copilot。从官网发布的演示来看,Copilot可以在Word、PowerPoint、Excel等多个应用中使用,经过优化的大语言模型(LLM)表现比直接嵌入ChatGPT更加出色。
以上信息综合自环球网、澎湃新闻等,图片来源于互联网。
编辑:徐远哲
责编:李洋 官毅
审核:冯飞
