黄仁勋的GTC大会集齐 Transformer 论文七大作者

2024.3.21 今日简讯

- 快手CEO程一笑昨日在业绩电话会上谈道，公司有信心在未来半年内达到GPT-4水平。

- 三星正在开发自研AI芯片Mach-1。

- Transformer架构8位作者中的7位受邀在GTC大会上圆桌对话中称当前模型规模都太小。

- 腾讯在2024全球游戏开发者大会上发布了自研游戏AI引擎GiiNEX。

- ChatGPT自去年5月以来，其月访问量已趋于平稳甚至下降，目前约为16亿。这揭示了面向消费者的AI商业模式的问题。

- 英伟达 CEO 黄仁勋预测十年内 AI 将能实时生成游戏中的所有像素。

- 马斯克在 X（推特）上发文宣布，继“心灵感应”（Telepathy）之后，其脑机接口公司 Neuralink 的下一个产品将是“盲视”（Blindsight），助视障人群恢复视力。

- 据福布斯援引知情人士消息报道，AI独角兽Stability AI核心技术团队被曝集体离职。

- AI创企Cohere正在寻求60亿美元估值的新投资，这将是其年化收入的450倍。

- 谷歌今日在《自然》（Nature）杂志发表论文，预报洪水。

原文：https://blog.google/technology/ai/google-ai-global-flood-forecasting/

黄仁勋集齐Transformer论文七大作者

Transformer模型通过自注意力机制，有效解决了长距离依赖问题，显著提升了序列数据处理的速度，对人工智能领域产生了深远影响。

作者们讨论了大型模型对计算资源的需求，以及如何通过自适应计算来更有效地分配这些资源。他们认为，当前的模型在某些情况下过于经济实惠，规模也还太小。

讨论中提到了推理能力的重要性，以及如何通过数据和模型来提升AI的推理能力。作者们认为，理解数据背后的逻辑和模式对于AI的发展至关重要。

作者们对未来AI模型的发展方向提出了展望，包括更高效的模型设计、更智能的数据处理方式，以及如何让AI更好地理解和生成内容。

谷歌宣布其多模态大模型Gemini 1.5 Pro推出API

开发者现在可以在AI Studio UI中试用

地址：

https://aistudio.google.com/app/apikey

创企Sakana AI发布首个大模型成果

团队构建了三个基于日语的模型，分别是日语大语言模型EvoLLM-JP、使用日语对话的图像语言模型EvoVLM-JP、高速日语图像生成模型EvoSDXL-JP。

体验地址：

https://huggingface.co/spaces/SakanaAI/EvoVLM-JP

微软发布视频生成多AI Agents框架Mora

利用Agent还原Sora能力，实现了文本到视频生成、文本+图像到视频生成、扩展生成视频、视频到视频编辑、连接视频和模拟数字世界等功能。

论文地址：

https://arxiv.org/html/2403.13248v1

Stability AI 演示 MindEye

让“提示词工程师”的价值大幅降低的MindEye2，不依赖于特定的提示词，而是直接基于用户脑电波生成，也就是说用户大脑想要什么，未来该模型就能生成什么。

地址：

https://stability.ai/research/minds-eye

北大发布新视频转视频项目FRESCO

可将视频转换成不同风格的视频，简化视频处理工作流程，已开源。

项目地址：

https://github.com/williamyang1991/FRESCO

img2img-turbo：图片转绘工具

来自CMU、Adobe的团队在arXiv上发表论文，提出的一种图像推理方法。