“AI届汪峰”谷歌的Astra是强势反击GPT-4o,还是又被抢了风头?

 夕小瑶科技说 原创
 作者 | Zicy

在5月15号凌晨的一年一度的“谷歌科技春晚”,即Google I/O开发者大会上,110分钟的发布会中,“AI”这个词被提及了121次。

目前,大模型竞争已经进入白热化阶段,本次开发者大会自然也围绕AI这一关键词展开。期间,Google宣布了一系列新的重大举措,其中最受关注的是实时语音助手Project Astra,对标OpenAI的GPT-4o。

但这次的Project Astra却再一次遭遇了OpenAI的“贴脸输出”。在本月的月初,一直有消息称5月9号OpenAI会举办一场发布会,但是最后又被推迟。时间好巧不巧,恰好推迟到Google I/O 开发者大会的前24小时,5月14号的凌晨。于是提前Project Astra 24小时,OpenAI率先发布了自己的实时语音助手GPT-4o,先抢占了一波热度。

但类似的事情不是第一次发生,早在今年2月,Google发布了Gemini 1.5 Pro,可以支持1M上下文的token,相比之下GPT-4 Turbo也仅支持128K上下文,但是OpenAI随后发布了文生视频模型Sora,直接吸走了一大波热度。

这下“AI届汪峰”的名号坐实了,任谁看了不得不说一句,高端的商战往往采取朴素的方式。

话虽这么说,但是Project Astra和GPT-4o的实际性能对比如何呢?

Project Astra vs GPT-4o

目前没有关于两个模型对比的明确指标,但是我们可以先从官方的demo中看个大概,Project Astra不但能和人类流畅交流,甚至能直接通过摄像头帮忙读代码。

Google的CBO Philipp Schindler也在推特上放出了一段在他的办公室录制的视频。

更牛的是,Astra能记住他所看到的东西。

对比之前GPT-4o在发布会上的表现

编者表达一下自己的看法,两者各有各的优点,似乎Project Astra具有更长的上下文能力,而且Google具有自己的硬件优势,在第一个demo结尾展示了将增强现实和人工智能的完美结合(边撸狗边和AI对话)。

但GPT-4o在情感上更加丰富,而且GPT-4o的交互更加流畅,延迟更低。GPT-4o的流畅可能是因为其模型结构更加精简,这意味着需要更少的算力,这可能就更加方便市场化的应用。

这两个突如其来的大动作,网友也是纷纷表示震惊

Project Astra这次是强势反击还是又被抢了风头?目前,关于Project Astra的性能指标,比如生成质量,数学能力和推理能力还尚未公开,但从demo演示上,似乎是与GPT-4o不相上下。未来随着更多性能指标的公开和用户反馈的积累,或许我们可以更全面地了解这两款AI模型的真正实力。

参考资料

[1]https://deepmind.google/technologies/gemini/project-astra/
[2]https://twitter.com/GoogleDeepMind

相关推荐

  • 利用TensorRT-LLM 加速 Whisper 推理实践应用
  • 联通RAG技术应用实践
  • 第三代指标平台如何摆脱 ETL 宽表开发 做“轻”数仓
  • 一个悄然崛起的国产开源大模型!
  • 估值52亿,上海又跑出一个新能源造车IPO
  • 亚马逊云科技 CEO 将离职:“云的未来是光明的”
  • 共话智能测试新机遇,AI4SE 创新巡航活动“走进软通动力”成功举办
  • 百度文心智能体平台举办开发者沙龙,打造国内领先的智能体生态 | Q推荐
  • OpenAI 的元老科学家们都跑光了!一个时代结束了?
  • ICML 2024 | 大语言模型预训练新前沿:「最佳适配打包」重塑文档处理标准
  • 李飞飞解读创业方向「空间智能」,让AI真正理解世界
  • 专访文青松|AI时代的教育革新:深度融合,驱动未来
  • 18个月,OpenAI这支团队搞出了GPT-4o
  • 用GAI定义手机,联发科和朋友们在行动
  • 【严肃警告】通报全体,公司没有午休这件事,从未有过,谁在中午午休立刻走人,没有下次!
  • 紧跟Ilya,OpenAI超级对齐团队负责人官宣离职!内部AGI或实现,全网陷大猜想
  • 「懂物理」是具身智能核心!北大高逼真物理仿真,加持磁性微米级机器人登Nature子刊
  • GPT-4o手写板书以假乱真惊呆网友!杀死谷歌翻译,代码建模无所不能
  • GPT-4o 17人Omni金牌团队首揭秘!清北上交中科大6位华人领衔
  • ACM MM 2024深度多模态生成和检索研讨会,诚邀各界专家学者参与