2024.3.21 今日简讯
- 快手CEO程一笑昨日在业绩电话会上谈道,公司有信心在未来半年内达到GPT-4水平。
- 三星正在开发自研AI芯片Mach-1。
- Transformer架构8位作者中的7位受邀在GTC大会上圆桌对话中称当前模型规模都太小。
- 腾讯在2024全球游戏开发者大会上发布了自研游戏AI引擎GiiNEX。
- ChatGPT自去年5月以来,其月访问量已趋于平稳甚至下降,目前约为16亿。这揭示了面向消费者的AI商业模式的问题。
- 英伟达 CEO 黄仁勋预测十年内 AI 将能实时生成游戏中的所有像素。
- 马斯克在 X(推特)上发文宣布,继“心灵感应”(Telepathy)之后,其脑机接口公司 Neuralink 的下一个产品将是“盲视”(Blindsight),助视障人群恢复视力。
- 据福布斯援引知情人士消息报道,AI独角兽Stability AI核心技术团队被曝集体离职。
- AI创企Cohere正在寻求60亿美元估值的新投资,这将是其年化收入的450倍。
- 谷歌今日在《自然》(Nature)杂志发表论文,预报洪水。
原文:https://blog.google/technology/ai/google-ai-global-flood-forecasting/
黄仁勋集齐Transformer论文七大作者
Transformer模型通过自注意力机制,有效解决了长距离依赖问题,显著提升了序列数据处理的速度,对人工智能领域产生了深远影响。
作者们讨论了大型模型对计算资源的需求,以及如何通过自适应计算来更有效地分配这些资源。他们认为,当前的模型在某些情况下过于经济实惠,规模也还太小。
讨论中提到了推理能力的重要性,以及如何通过数据和模型来提升AI的推理能力。作者们认为,理解数据背后的逻辑和模式对于AI的发展至关重要。
作者们对未来AI模型的发展方向提出了展望,包括更高效的模型设计、更智能的数据处理方式,以及如何让AI更好地理解和生成内容。
谷歌宣布其多模态大模型Gemini 1.5 Pro推出API
开发者现在可以在AI Studio UI中试用
地址:
https://aistudio.google.com/app/apikey
创企Sakana AI发布首个大模型成果
团队构建了三个基于日语的模型,分别是日语大语言模型EvoLLM-JP、使用日语对话的图像语言模型EvoVLM-JP、高速日语图像生成模型EvoSDXL-JP。
体验地址:
https://huggingface.co/spaces/SakanaAI/EvoVLM-JP
微软发布视频生成多AI Agents框架Mora
利用Agent还原Sora能力,实现了文本到视频生成、文本+图像到视频生成、扩展生成视频、视频到视频编辑、连接视频和模拟数字世界等功能。
论文地址:
https://arxiv.org/html/2403.13248v1
Stability AI 演示 MindEye
让“提示词工程师”的价值大幅降低的MindEye2,不依赖于特定的提示词,而是直接基于用户脑电波生成,也就是说用户大脑想要什么,未来该模型就能生成什么。
地址:
https://stability.ai/research/minds-eye
北大发布新视频转视频项目FRESCO
可将视频转换成不同风格的视频,简化视频处理工作流程,已开源。
项目地址:
https://github.com/williamyang1991/FRESCO
img2img-turbo:图片转绘工具
来自CMU、Adobe的团队在arXiv上发表论文,提出的一种图像推理方法。
项目地址:
https://github.com/GaParmar/img2img-turbo
体验地址:
https://huggingface.co/spaces/gparmar/img2img-turbo-sketch