文心大模型 4.0 发布!宣称对标 GPT 4.0


从搜索、文库到商业分析,AI 大模型成了百度的「纵贯线」。
作者 | Li Yuan
编辑 | 靖宇   转自|极客公园
欢迎来到生成式人工智能的时代!2023 年 10 月 17 日,身着白衬衫和小白鞋,百度创始人、董事长兼首席执行官李彦宏在台上宣布了一个新时代的到来。这场以「生成未来」命名的发布会上,李彦宏正式发布公司的大语言模型文心大模型的最新 4.0 版本,同时手把手教人们,如何用提示词,让升级的文心大模型应用,帮助人们用北京公积金在河北买房、制作广告和视频以及创造网文小说。李彦宏在会上将文心大模型 4.0 直接和 GPT-4 对标|百度在会上,李彦宏自信地表示文心大模型 4.0 版本的能力,「和 GPT-4 比毫不逊色」同时,半年前宣布「所有应用都值得用大模型重构一遍」的说法,也在当天的会上有了结果。从主营业务搜索,到百度文库、网盘、地图等百度全家桶应用,都已经接入文心大模型,展现出更好的交互和逻辑能力。在 B 端,李彦宏也曝光了 GBI(生成式商业分析)工具,以及大模型能力加持的办公助理「如流」。如果说生成式人工智能激活了整个科技圈,那么百度可能是那个受益最大的巨头。


01

文心 4.0 

直接对标 GPT-4


发布会一开场,李彦宏首先宣布发布了文心大模型 4.0 版本。百度对于大模型的能力,划分了四个界定标准:理解、生成、逻辑和记忆。此次的文心大模型 4.0 升级,基础架构仍然与 3.0 和 3.5 版本相同,但宣称在逻辑和记忆的方面提升较大。李彦宏公布文心大模型 4.0|百度按照百度 CTO 王海峰的介绍,文心大模型 4.0 理解和生成能力的提升幅度相近,而逻辑的提升幅度是理解的 3 倍,记忆的提升幅度是理解的 2 倍四个不同的能力,能够提升不同应用场景的效率。对这几大能力,李彦宏都进行了现场展示。理解是对话式人工智能帮助用户的基础,在政务、营销、客服等等领域十分重要。在理解能力上,现场用了一个语序颠倒,模糊表述的 prompt(提示词)来测试模型的能力:「我想回承德买房,能用公积金贷款吗?手续怎么办?我在北京工作。」要理解这句话,AI 必须理解到「在北京工作」和「回承德买房」,其实具有「在北京缴纳公积金,而户口在承德。」这种极具中国特色的潜台词,才能做出准确的,用户需要的回答。而果然,文心一言迅速地理解了问题的关键,做出了正确的回答。李彦宏阐释 AI 的四大核心能力|百度而生成能力,主要可以提升品牌营销、文案策划和创意类工作的效率。在现场,李彦宏展示了根据一张图片,用自然语言提示,就能进行背景转换,主体模糊处理,根据官网信息生成海报和文案等多种处理。而除了这些传统的图片处理之外,此次百度还展示了视频的生成能力。通过自然语言的 prompt,在现场演示中,文心一言用几乎没有延时的速度,生成了一条数字人的口播视频广告。视频中融入了产品图,增加了许多过渡背景,还有一位身着西装的数字人不时出现,介绍从官网搜集来的产品特点。现场展示文心大模型 4.0 的广告生成能力|百度原本多个 AIGC 产品合作才能做出的效果,在这个展示中,无缝地实现了融合。一条广告片,5 个广告文案,还有一张海报,全过程生成只用了不到 3 分钟。逻辑推理,通常表现为数学逻辑的测试。此次的展示,百度着重表现了它在教育方面的潜能。李彦宏给出了一道涉及到锥形体积转换成长方体体积的应用题,文心一言不但给出了解答,同时能够按步骤解题,并分析出每个步骤中涉及到知识点。用生成式人工智能给孩子辅导功课更简单了|百度对于记忆能力的展示,百度的选择比较特别。百度选择让文心一言撰写一个武侠小说的大纲设定。在撰写完成后,在原本的提纲上,让大模型增加人物关系,增加戏剧冲突,来展现大模型在增加了复杂信息之后,还能够记得原本的提纲设定和人物能力,没有漫无边际地发挥想象力。百度也分享了文心大模型能力进步的技术支持。百度之前就曾宣布,文心大模型是国内首次使用万卡集群训练的大模型,不少人猜测此次文心大模型 4.0 的参数规模预计突破万亿级别。不过,在此次发布会上,百度并没有强调大模型的参数级别。除了万卡训练之外,百度 CTO 还提到了百度的算法训练稳定性的周均值已经超过了 98%,在输入和输出方面,都进行了知识点增强的技术


02

「重构」百度全家桶


虽然进行了分别展示,实际上更多时候,大模型的四项基础能力是复合应用的。5 月,百度就曾宣布利用大模型重构百度旗下的应用。而此次发布会上,百度也展示了百度应用文心大模型重构的最新成果。其中,最惊艳的是对于搜索的重构。2 月,微软就已经基于 GPT 的技术推出了 New Bing,对其搜索进行重构。而在最新的出庭证词中,微软的纳德拉表示自从将人工智能功能添加到 Bing 以来,微软在搜索市场的份额几乎没有变化。微软的 New Bing 主要是推出了一个对话机器人的体系,可以与 New Bing 聊天提问来获得带链接的整合信息。谷歌的 Bard 也与此相似。百度用 AI 重构主营业务搜索|百度但百度此次推出的搜索重构则更加深入整个搜索体系。百度将其形容为「极致满足、推荐激发、多轮交互」。极致满足体现在搜索框里输入问题,搜索可以不再是给出链接,而是直接生成一个最好的答案在演示中,李彦宏提出了一个过去 20 年各国工业增加值排名是多少的问题。不同于 New Bing 和 Bard 可能会给出一个带链接的数据答案,新的百度能够直接给出一个动态的表图,以条形图的形式,显示不同国家工业增长值。这个图甚至是动态的,会随时间进行增长和排名变化。推荐激发功能有点相当于目前搜索引擎的相关问题,可以提示用户继续根据提示了解一些相关问题,如「工业增加值和 GDP 有什么关系?」「工业对国民经济发展有什么影响?」。李彦宏分享 AI 重构百度全家桶应用心得|百度而多轮交互也十分有趣。目前的大语言模型创业浪潮中,其中有一个许多创业者都在努力的方向,就是利用大语言模型搭配推荐引擎,进行多轮对话,来向用户提供一个最佳选择。9 月,百度举办的文心杯的创业大赛项目,其中的一等奖获得者 Buysmart.AI 是这个方向的佼佼者。用户用自然语言和点选,不断清晰自己的需求,而 Buysmart.AI 利用推荐引擎最终为用户推荐最需要的产品。而重构后的百度搜索,直接在搜索中增加了类似方向的功能。在演示中,百度的搜索提示词是询问「北京周边登山去哪好?」而搜索引擎在给出了百花山、海坨山等等多个答案后,允许用户进一步点选补充选择自己的情况。比如如果选择徒步新手加亲子,搜索引擎就会改为改为推荐西山和百望山这样的地点,它们相对好爬,对亲子活动也比较友好。除了搜索的重构之外,百度还展示了对于百度网盘、百度地图、百度文库等应用的重构。百度网盘的云一朵个人云助理,在之前就已经推出。作为世界上第一个个人云助理,目前用户已经达到 2000 万。可以用自然语言与助理沟通,一句话操作找到个人云中的某段视频,对于视频内容进行理解,找到视频中的某项内容,总结出视频的金句等等。百度地图,按照百度的宣传,是全球首个 AI 原生地图产品。通过与地图的助手对话,可以一步直达多级菜单的几千个服务。也可以推荐地理位置合适的餐厅,对比餐厅的环境进行选择,最后直接约车。百度文库依托十亿过去的文稿资源,可以直接在用户对特定题材搜索资料后,勾选需要的文章类型,严肃学术文献或是普通大众材料,进行一键文章生成。重构后的百度文库还添加了 PPT 生成的功能,能够理解观点之间是并列关系还是递进关系,进行 PPT 风格风格一键切换,百度宣称「远超市场上其他 PPT 生成工具。」


03

发力 B 端


在此次的演示中,百度还展示了一些全新的 B 端应用。其中,此次百度重点推出的是一个商业智能产品。百度 GBI,Generative Business intelligence。这是一个百度推出的全新产品,是国内首个生成式商业智能产品,具有支持自然语言交互、跨数据库分析和专业知识学习三方面能力,将商业分析师十几天才能完成的数据分析工作缩短到分钟级。瞄准 B 端的百度 GBI 产品|百度在广告片中,面对「成本本预估是多少?不亏钱的价格底线是多少?客户要求我们 3 个月内完成交付,能做到吗?最快多久?如果竞对,比如我们的报价低,有什么办法?」这一系列相关的财务分析、项目交互、用户分析的问题,百度 GBI 可以直接通过自然语言对话,给出答案,并生成图文并茂的回答。不需要专业人士进行操作,跨数据库和表格接入数据也不需要额外的操作。除此之外,企业还可以对其训练,让其学习专业知识,成为行业专家。另一个 B 端产品是如流。使用生成式 AI 进行重构后,如流可以一键生成会议纪要,总结上千条工作群的内容。结合企业的 CRM 系统,为管理者提出项目背景和项目谈参。根据个人行程,规划工作计划,发出会议邀约等等。除了赋能办公方面,百度还展示了大模型对于自动驾驶、智能座舱和政府智慧监控项目的赋能。发布半年多以来,文心快速迭代,重构百度应用,同时在逐步建立文心生态。百度也在发布会上介绍了近期上线的灵境平台。无论是个人或者企业的数据或者是应用,都能够在灵境平台上快速变成一个插件,利用 api 接入文心大模型的能力中。李彦宏预言即将到来的 AI 生态时代|百度百度介绍,目前灵境平台上线一个月的时间,已经有 2.7 万个开发者的申请入驻,覆盖了 20 多个领域,包括法律咨询、简历生成,脑图制作、口语练习等等各种各样的场景的原生应用。企业私有数据在没有泄露风险的情况下,也能够方便快捷地接入最先进的这个大模型的能力。中国有丰富的应用场景,中国用户又天然愿意拥抱新技术,有了先进的基础大模型,我们就能构建起一个繁荣的 AI 生态,共同创造新一轮经济增长。」李彦宏表示。
*头图来源:百度本文为极客公园原创文章,转载请联系极客君微信 geekparkGO


可以加入技术琐话读者群,请后台回复:读者群

往期推荐:

技术琐话 



以分布式设计、架构、体系思想为基础,兼论研发相关的点点滴滴,不限于代码、质量体系和研发管理。



相关推荐

  • 未来3年,请做好随时失业的准备!
  • AI 产品榜 (2023 年 9 月)APP 增长榜,APP 依然不是优先策略
  • 1021.AI日报:GPT-4 教机器人手转笔,还挺6
  • 基于llama7B的文本嵌入模型ANGLE:兼看Agent微调数据的生成方案
  • 开源项目:无缝多媒体体验的终极视频播放器,屏幕娱乐的完美伴侣
  • 半导体巨头AMD也要裁员了!
  • 华为家属:4年提前还款219.36W,剩余每月房贷5.1元
  • 限时赠票|关于 AI 赋能、智能高清、音视频技术...小红书邀你参加「RTE 实时互联网大会」
  • CNCC 2023 | 五位重磅大咖齐聚沈阳,共同探讨「大模型与推荐系统」
  • 开源联合,聚力共赢,2023 CCF中国开源大会在长沙开幕
  • 1024程序员节|和华为共赴一场属于开发者的硬核大会
  • 北大开源代码大模型CodeShell,提供了配套的IDE插件
  • Hugging Face被限制访问
  • 云原生 IDE 将成为常态
  • 10个解放双手的 IDEA 插件,这些代码真不用手写
  • 英伟达开源新Agent!用了GPT-4后,机器人把转笔、盘核桃都玩明白了
  • 推特爆火!超越ChatGPT和Llama2,新一代检索增强方法Self-RAG来了
  • 聊聊昨日ChatGPT全球宕机事件,带给我们的警示
  • 一笔卖了95亿的山东博士火了
  • 我们公司的官网上线了!