传Stability AI核心技术团队集体离职;Sora复现项目Mora发布;三星明年推出AI芯片Mach-1丨AIGC大事日报
03 / 21全球AIGC产业要闻1、Sora复现项目Mora发布2、传微软因担忧OpenAI而聘用Inflection员工3、ChatGPT停滞揭示了ToC AI的问题4、OpenAI的GPT商店充斥着“垃圾”5、Stability AI核心技术团队被曝集体离职6、谷歌AI洪水预报论文登Nature7、谷歌因侵权出版商被罚款2.5亿欧元8、谷歌Gemini 1.5 Pro推出API9、Transformer五作创企发布首个大模型成果10、Transformer作者称当前模型规模都太小11、传Cohere寻求估值60亿美元新投资12、淘宝“星辰”大模型上线 用于电商场景13、腾讯发布自研游戏AI引擎GiiNEX14、快手CEO:半年内达GPT-4水平15、循环智能与月之暗面合作行业大模型16、华人团队推出视频扩展模型MOTIA17、三星计划明年推出AI芯片Mach-118、Meta发布室内场景重建方法SceneScript19、Adobe新研究0.11秒从草图生成图像20、Anthropic与AWS将合作ToB生成式AI21、AI基础设施创企Astera Labs首日大涨76%22、AI Pin将从4月11日开始发货23、AI推动IBM市值上涨19%24、加拿大等试图挖走欧洲顶尖AI创企1、Sora复现项目Mora发布今日,来自理海大学、微软的团队发布视频生成多AI Agents框架Mora,利用Agent还原Sora能力,实现了文本到视频生成、文本+图像到视频生成、扩展生成视频、视频到视频编辑、连接视频和模拟数字世界等功能,目前支持生成1024*576分辨率的12秒视频。论文地址:https://arxiv.org/html/2403.13248v12、传微软因担忧OpenAI而聘用Inflection员工据美国《商业内幕》报道,内部人士称,微软对AI创企Inflection进行大规模招聘,是因为其董事会对OpenAI的不稳定感到担忧,以及内部对面向消费者的AI愿景和战略的怀疑。3、ChatGPT停滞揭示了ToC AI的问题据美国《商业内幕》报道,流量分析网站Similarweb数据显示,AI创企Inflection的聊天机器人Pi网站2月份访问量刚刚超过400万次,作为对比,社交平台X的的DAU(日活跃用户)超过2亿,Instagram的DAU超过5亿。此外,ChatGPT于2022年11月推出后,月访问量飙升至18亿,但自去年5月以来,其月访问量已趋于平稳甚至下降,目前约为16亿。来自初创公司Character.ai、Perplexity AI和Anthropic的聊天机器人在网络访问方面也远远落后。这揭示了面向消费者的AI商业模式的问题。4、OpenAI的GPT商店充斥着“垃圾”据TechCrunch今日报道,OpenAI的GPT商店中充斥着奇怪的、可能侵犯版权的GPT,这意味着OpenAI的审核工作很松懈。例如有的GPT声称能够以迪士尼和漫威作品的风格生成艺术,但其作用只不过是第三方付费服务的渠道。5、Stability AI核心技术团队被曝集体离职据福布斯援引知情人士消息报道,AI独角兽Stability AI上周在全体员工会议上宣布,文生图模型Stable Diffusion核心研究团队集体辞职,包括五位论文作者中的三位Robin Rombach、Andreas Blattmann和Dominik Lorenz,其中前两人是共同一作。6、谷歌AI洪水预报论文登Nature谷歌今日在《自然》(Nature)杂志发表论文,展示了AI如何帮助其扩大洪水预报范围,并为世界上受气候变化影响最严重的地区提供帮助。据介绍,AI可以提前7天提供准确的河流洪水信息,能够为80个国家/地区4.6亿人居住的地区提供洪水预报。谷歌称会在搜索、地图和安卓通知提供预报。7、谷歌因侵权出版商被罚款2.5亿欧元今日,法国竞争管理局宣布对谷歌多个实体处以2.5亿欧元(约合美元2.73亿)罚款,因为后者在训练AI模型时使用了出版商和新闻机构的内容来训练其创始模型,而没有通知他们或管理局。8、谷歌Gemini 1.5 Pro推出API今日,谷歌宣布其多模态大模型Gemini 1.5 Pro推出API(应用程序接口),开发者现在可以在AI Studio UI中试用。9、Transformer五作创企发布首个大模型成果今日,创企Sakana AI发布首个研究成果,提出了一种自动融合多种现有模型来构建优秀基础模型的方法,并发布了原型模型。为了演示这种方法,团队构建了三个基于日语的模型,分别是日语大语言模型EvoLLM-JP、使用日语对话的图像语言模型EvoVLM-JP、高速日语图像生成模型EvoSDXL-JP。Sakana AI成立于2023年8月,由两位著名的前谷歌研究人员David Ha和Llion Jones创立,其中Jones是著名的Transformer论文《Attention Is All You Need》的第五位作者。论文地址:https://arxiv.org/abs/2403.13187Demo地址:https://huggingface.co/spaces/SakanaAI/EvoVLM-JP10、Transformer作者称当前模型规模都太小今日,Transformer架构8位作者中的7位受邀在GTC大会上圆桌对话。他们提到世界需要比Transformer更好的东西,认为当前的模型太过经济实惠,规模也还太小,自适应计算是接下来必须出现的事情之一等。11、传Cohere寻求估值60亿美元新投资据The Information今日报道,两位知情人士透露,AI创企Cohere正在寻求60亿美元估值的新投资,这将是其年化收入的450倍。这个估值倍数远高于其他AI创企,作为对比,OpenAI的估值约为其预期收入的50倍。另一位知情人士称,Cohere一直在寻求超5亿美元的融资。12、淘宝“星辰”大模型上线 用于电商场景据Tech星球今日报道,淘宝天猫集团自研大模型“淘宝星辰”已经上线官网,这也是淘天集团公开的首个自研大模型。官网除了显示该大模型的介绍外,还设置有“立即体验”和“登录/注册”入口,或将在不久对外开放。据悉,星辰大模型基于Transformer架构,采用半自研的Megatron-ama框架进行训练,从海量电商消费数据和公开数据中持续学习,提供电商和生活服务场景增强的文案生成、多轮会话、知识问答、智能决策等能力。13、腾讯发布自研游戏AI引擎GiiNEX据北京商报报道,昨日,腾讯在2024全球游戏开发者大会上发布了自研游戏AI引擎GiiNEX。该引擎借助大模型等生成式AI技术,面向AINPC、场景制作、内容生成等场景,提供了包括2D图像、3D城市、剧情等多样化的AIGC能力,帮助开发者提升高质量内容生成的效率。同时,GiiNEX也将决策AI技术用于游戏研发测试、模拟玩法等场景。14、快手CEO:半年内达GPT-4水平据新浪科技报道,快手CEO程一笑昨日在业绩电话会上谈道,快手自研大模型快意的综合性能已经大幅超过GPT-3.5,公司有信心在未来半年内达到GPT-4水平。在多模态方面,快手文生图大模型“可图”综合性能已经超过Midjourney V5。文生视频方面,快手一直有研究和投入,并在去年年底积极推进视频生成技术的专利研发,未来会把生成模型和生产者工具结合起来,帮助创作者降低创作门槛,提升短视频制作的质量和效率。15、循环智能与月之暗面合作行业大模型今日,行业大模型解决方案提供商循环智能(Recurrent AI)宣布,与研发“Kimi智能助手”的通用大模型公司月之暗面(Moonshot AI)达成深度战略合作。循环智能将基于月之暗面的通用大模型,为业界提供更优质的针对各种业务场景的行业大模型解决方案及应用。16、华人团队推出视频扩展模型MOTIA今日,来自香港中文大学、上海AI实验室、商汤科技等机构的华人团队推出视频扩展模型MOTIA。该方法利用源视频的固有数据特定模式和图像/视频生成先验来实现有效的扩展。MOTIA包括两个主要阶段:输入特定调整、模式感知扩展。此外作者提出了额外的策略,包括空间感知插入和噪声传播,以更好地利用扩散模型的生成先验和从源视频中获取的视频模式。项目地址:https://be-your-outpainter.github.io/论文地址:https://arxiv.org/abs/2403.1374517、三星计划明年推出AI芯片Mach-1据《首尔经济日报》报道,昨日,三星电子半导体部门负责人在股东大会上宣布,公司正在开发自研AI芯片Mach-1,该芯片已通过FPGA完成技术验证,SoC设计正在进行中。Mach-1预计将拥有前所未有的结构,可以将数据传输速度瓶颈降低到当前水平的1/8。此外,它将是一款轻量级AI芯片,可以使用LPDDR内存,而不仅仅依赖于HBM。该芯片将于今年年底投入生产,基于此芯片的AI系统将于明年初面市。18、Meta发布室内场景重建方法SceneScript昨日,Meta发布了一种使用自回归结构化语言模型重建场景的方法SceneScript。该方法使用场景语言编码器-解码器架构,直接从编码的视觉数据中推断出一组结构化的语言命令。为了训练SceneScript,作者生成并发布了一个大规模的合成数据集,名为Aria Synthetic Environments,包含10万个高质量的室内场景,其中包括以自我中心场景漫游的真实感和地面真实标注的渲染图像。论文地址:https://arxiv.org/abs/2403.1306419、Adobe新研究0.11秒从草图生成图像3月19日,来自CMU、Adobe的团队在arXiv上发表论文,提出一种图像推理方法。据介绍,该方法解决了现有条件扩散模型的两个限制:由于迭代去噪过程导致的推断速度较慢、对配对数据进行模型微调的依赖。为了解决这些问题,作者引入了一种通用方法,通过对抗学习目标将单步扩散模型适应于新的任务和领域,既能利用预训练扩散模型的内部知识,同时还能实现高效的推理。对于512*512的图像,在A6000上生成时间为0.29秒,在A100上为0.11秒。论文地址:https://arxiv.org/pdf/2403.12036.pdf试玩地址:https://huggingface.co/spaces/gparmar/img2img-turbo-sketch20、Anthropic与AWS将合作ToB生成式AIAI创企Anthropic今日宣布与AWS和埃森哲达成合作,将生成式AI部署到企业中来满足其特定需求,同时保持数据的私密性和安全性。超过1400名埃森哲工程师将接受培训,在AWS上使用Anthropic模型为客户提供端到端支持。21、AI基础设施创企Astera Labs首日大涨76%据彭博社报道,AI基础设施创企Astera Labs昨日登陆纳斯达克后,其股价飙升76%,市值达到96.8亿美元。22、AI Pin将从4月11日开始发货今日,创企Humane发布了一段AI Pin设备的规划以及最终发货版本的演示视频,提到将会从4月11日开始发货,首批订购者将在五月收到货物。23、AI推动IBM市值上涨19%据彭博社昨日报道,科技巨头IBM市值最近创下自2013年以来的最高记录,略低于历史最高点6%,其今年涨幅约19%。投资人士称,这可能与其大量的云和AI投资以及强大的AI业务相关。24、加拿大等试图挖走欧洲顶尖AI创企据英国《金融时报》今日报道,知情人士透露,加拿大和阿联酋官员近几个月接触了德国的Aleph Alpha、英国的Synthesia和Stability AI等顶尖AI创企,通过补贴、宽松的税收制度和宽松的监管等方式说服它们搬迁。
2024年中国生成式AI大会预告
相关推荐
现场采访黄仁勋:20个灵魂问题,谈GPU定价和中国出口,怼AGI时间表
张勇 × 刘晓丹,顶峰相见| 底片
12条SQL不起眼的数仓调优技巧
洗一次68元,单月成交总额能做到6500万,搞钱就是要做复利的事情
用大语言模型控制交通信号灯,有效缓解拥堵!
今日arXiv最热NLP大模型论文:华东师大发布对话级大模型幻觉评价基准DiaHalu
超越 GPT-4V 和 Gemini Pro!HyperGAI 发布最新多模态大模型 HPT,已开源
【收藏】GTC2024必看演讲|对话视频系列 · 之一
Beyond Compare! Rust Vs Js
招募200名互联网运营师,不限经验,男女可报!居家办公!
[开源]MIT开源协议,智慧协同办公OA,企业级协同办公整体解决方案
每日 prompt:黑猫手机壁纸
黄仁勋的GTC大会集齐 Transformer 论文七大作者
工厂数字化系统是自研?还是对外采购?
3.8K Star小众Dart实现的键鼠输入可视化软件
大模型时代,5个最顶级的向量数据库
Android玩家折腾不动了
Oracle正式发布Java 22
开源日报 | 马斯克为何要作开源 “秀”;当初质疑倪光南的人,今天果然被打脸;Java 22正式GA;压缩的二三事
Redis不再 “开源”