百度谷歌成为AI黄埔军校，Transformer八子融资超8.7亿刀！「AI行业全景报告」总结GenAI大爆发

新智元报道

编辑：润好困

【新智元导读】由Air Street Capital创始人Nathan Benaich等人制作的「人工智能全景报告」出炉，像素级回顾了过去这一年AI行业不能错过的突破性技术和行业新发展！

一年一度的「人工智能全景报告」（State of AI Report）又出炉了！

报告链接：https://www.stateof.ai/

这份160多页的报告涵盖了AI研究、行业、安全等领域的内容，非常的全面，是每一个对AI感兴趣的人都不能错过的优质（而且免费）内容。

这份报告要是放在别的咨询公司手里，不花个1999你最多只能看前边5页！

技术层面，在过去一年生成式AI寒武纪大爆发的背景下，报告不但全面展示了生成式AI这一年的发展历程，将闭源模型和开源模型的你追我赶，不断突破模型能力边界的过程展现得淋漓尽致。

并且，还对AI安全技术，数据资源枯竭，模型能力基准测试，大模型技术与机器人，自动驾驶，智能体应用的突破等最前沿的技术领域做了深刻地总结和展望。

人类数据将在2025年耗尽？

作者花了大量的精力收集提炼了一年当中最有突破性和应用前景的AI技术，简明扼要地呈现出来，让读者不错过任何有价值有潜力的技术突破。

产业层面，作者从硬件基础设施（英伟达赢麻了），行业投融资风向，明星独角兽等方面，给读者呈现了技术走出实验室落地的成果。

算力成为海湾国家的新石油？

很多意料之外的生成式AI应用也吸引到了众多用户

AI安全性，今年成为了公众和政策制定者对于AI讨论最为火热的话题。不论是大佬们对于「开源闭源」的激烈讨论，还是「通向AGI的道路选择」，背后的核心议题都绕不开AI安全性方面的考量。

除此之外，报告对于很多单个亮点事件的捕捉，也是读者理解过去一年AI行业变化不能错过的内容。

闭源大模型：GPT-4遥遥领先

2023年当然是LLM之年，OpenAI的GPT-4震惊了世界，它成功击败了所有其他LLM——无论是在经典的AI基准测试上，还是在为人类设计的考试上。

甚至在很多为人类设计的考试上，它也超过大部分的人类。

由于安全和竞争方面的担忧，闭源模型的开放性有所减弱。

OpenAI公布了GPT-4 非常有限的技术报告，Google在PaLM 2的发布会上几乎没有发布什么有价值的信息，Anthropic根本没有公开Claude和Claude 2的技术细节。

开源模型紧追不舍，随时准备夺取王位

然而，作为开源AI的旗帜，Meta AI和其他公司通过训练和发布能够匹配GPT-3.5的许多功能的有竞争力的开放式 LLM点燃了开源的火种。

从Hugging Face的排行榜来看，开源比以往任何时候都更加活跃，下载量和模型提交量飙升至历史新高。

值得注意的是，在过去30天里，LLaMa系列模型在Hugging Face上的下载量已超过3200万次。

如何全面而公平地评估模型的性能，不论从学术研究的角度还是应用层面都是非常的挑战，同时也是非常有前景的应用。

Hugging Face的排行榜和斯坦福HAI研究中心的HELM作为其中的佼佼者，代表了评估体系的最流行和最全面的标准。

除了LLM，包括微软在内的研究人员一直在探索小规模语言模型的可能性，发现使用高度专业化的数据集训练的模型可以与50倍大的竞争对手相媲美。

如果Epoch AI的团队的研究预测，我们将面临在未来「两年」内耗尽高质量语言数据库存的风险，这促使科研人员必须探索出一条新的训练数据的替代来源。

虽然AI科研的新常态是美国的领先优势在不断缩小，但绝大多数高被引论文仍然来自少数几家美国机构。

谷歌+DeepMind遥遥领先，各大高校和大厂紧随其后。

中国对于AI学术的贡献不仅在于直接产生的论文，还培养大量的华裔AI科学家。

英伟达赢麻了

生成式AI的迅猛发展意味着现在是进入AI硬件赛道的好时机。

英伟达是目前可以说唯一赚钱也是赚钱最多的AI公司， GPU需求使他跻身「一万亿市值」俱乐部。

并且，他们的芯片在AI研究中的使用量是「所有替代方案总和」的19倍！

虽然英伟达会继续推出新的芯片，但他们的旧GPU却展现出了非凡的生命周期价值。

2017年发布的V100是2022年AI研究论文中最受欢迎的GPU。

而刚刚推出的H100的大规模的应用，也许将出现在多年之后。

对于H100高速增长的需求，各大公司和实验室急于构建大型集群。

然而，限制组建这种大规模算力集群的挑战，往往还体现在算力核心连接的工程难度之上。

生成式AI革命性进展

也许是有史以来最不令人惊讶的消息——Chat-GPT是有史以来增长最快的互联网产品之一。

它在开发人员中特别受欢迎，取代了Stack Overflow成为了开发人员寻找编码问题解决方案的首选资源。

但根据红杉资本的数据，目前有理由怀疑生成式AI产品的持久力——从图像生成到AI助手，几乎所有AI产品的用户留存率都不稳定。

而除了消费领域，各种迹象表明生成式AI可以加速整体AI行业的进步。

Wayve GAIA-1显示了令人印象深刻的通用性，可以作为训练和验证自动驾驶模型的强大工具。

除了生成式AI之外，之前一直在努力寻找和AI技术结合的各个行业都出现了大手笔的交易。

许多传统制药公司已All In人工智能，与Exscientia和InstaDeep等公司达成了价值数十亿美元的交易。

与此同时，风险投资行业的重担也落在了生成式AI的肩上，它撑起了Atlas等科技私募市场的天空。

如果没有生成式AI的繁荣，人工智能投资将比去年下降40%。

除了OpenAI与微软的100亿美元交易之外，「Transformer八子」已累计融资了至少8.7亿美元！

百度硅谷AI实验室的DeepSpeech 2团队情况也差不多。

他们在语音识别深度学习方面的工作向人们展示了现在支撑大规模人工智能应用的规模效应。该团队的大部分成员后来成为领先的机器学习公司的创始人或者高管。

然而，许多最引人注目的重磅融资根本不是由传统风险投资公司牵头的。

2023年是企业风险投资年，大型科技公司有效利用了其资金。

英伟达又又又赢麻了！

AI安全问题迫在眉睫

帮助ChatGPT成功破圈的RLHF，同样面临了非常多的挑战，也许新的替代技术已经在出现的路上了。

作者之前的AI行业报告曾经警告过，大型实验室和公司忽视了AI的安全性。

2023年就演变为了AI风险争论的一年，研究人员之间的「公开与封闭」争论愈演愈烈，「AI灭绝人类风险」屡次成为头条新闻。

参考资料：https://www.stateof.ai/

相关推荐

再阉割H800？美商务部新政加强限制GPU出口，预计本周公布

英伟达爆火智能体研究：AI逼真还原人类情感！会饿会孤独，会跑步会发火

YOLO再升级！华为诺亚提出Gold-YOLO，聚集-分发机制打造新SOTA

靠发AIGC论文拿了100万年薪！不是靠努力和勤奋，而是......

数据科学的业务价值转化秘籍

AB实验的关键变量

信息流场景下的AIGC实践

ReCon框架帮助AI大模型识破谎言，来看智能体如何在阿瓦隆游戏中应对欺骗

选择GPT-3.5、还是微调Llama 2等开源模型？综合比较后答案有了

语言、机器人破壁，MIT等用GPT-4自动生成模拟任务，并迁移到真实世界

狂揽10k star，微软AutoGen框架太火了，智能体聊聊天就把问题解决了

OpenAI科学家最新大语言模型演讲火了，洞见LLM成功的关键

权威赛事：“先锋杯”数字孪生创新应用大赛已火热开赛！

AirPods可以“读脑”了？还是能同时监测汗液乳酸浓度的那种｜Nature

大语言模型击败扩散模型！视频图像生成双SOTA，谷歌CMU最新研究，一作北大校友

OpenAI悄悄更改“价值观”：不All in AGI的别来沾边

全面的中文大语言模型评测来啦！香港中文大学研究团队发布

GPT-4V被曝离谱bug：突然执行神秘代码，空白图片读出打折信息，网友们都看呆了

这款Java调优方案，放到大厂相当炸裂！

一文讲透时序和序列数据的存储、搜索、分析及挖掘