OpenAI今夜将放什么大招？零一万物发布千亿参数闭源模型 Yi-Large

今日简讯 2024.5.12

- OpenAI将于美西时间5月13日上午10点（北京时间14日凌晨1点）拉开其春季更新活动的帷幕，通过线上直播的形式，向全球演示ChatGPT和GPT-4更新的功能。

- 微软公司周日宣布，将在法国投资 40 亿欧元（IT之家备注：当前约 311.6 亿元人民币），这笔投资将在 2027 年之前进行。

- 中美将举行人工智能政府间对话首次会议，交流科技风险及全球治理等问题。

- 马克·扎克伯格表示，长期的GPU荒已经基本结束，而是将面临能源问题的挑战，功耗将限制 AI 增长。

- 英国推出开源免费的 AI 模型安全评估平台Inspect，向全球 AI 工程师免费开放。

- 研究测试：AI 以 3-0 击败人类在道德图灵测试中。

- 研究人员使用AI技术鉴别eBay上的艺术品，发现多达40件赝品。

- 美国教授用 2 岁女儿训 AI 模型登 Science，人类幼崽头戴相机训练全新 AI。

- Anthropic 上周更新自家服务政策，允许第三方将自家 Claude 等 AI 模型用于“未成年人产品”中。

- 甲骨文推出 Oracle Code Assist 编程助理，可用 AI 写 Java 程序。

- 字节跳动收购OWS公司大十科技Oladance，有望推出AI智能眼镜。（放一个开源项目Open Glass AI，它可以20美元就能把任何眼镜改装成AI眼镜。）

地址：

https://github.com/BasedHardware/openglass

他表示 Yi-Large 的多数指标可对标甚至是超越 GPT 4.0。该模型在斯坦福大学最新的 AlpacaEval 2.0 评估中，全球大模型胜率（Win Rate）排第一、文本长度误差的胜率（LC Win Rate）排第二。推荐这篇访谈内容《对话李开复：这次大模型创业，我十年都不会变现》

研究人员提出了一种全新自动化文本动画方案「文字跳动」，实现了文本与动画的完美融合。1. 根据用户的描述，字母将被变形从而传达文本语义。2. 变形的字母将被赋予用户描述的生动动态效果，从而达成文字动画。

项目地址：

https://animate-your-word.github.io/demo/

Sepp Hochreiter 在 arXiv 上发布论文，提出了一种名为 xLSTM（Extended LSTM）的新架构，号称可以解决 LSTM 长期以来“只能按照时序处理信息”的“最大痛点”，从而“迎战”目前广受欢迎的 Transformer 架构。

论文地址：

https://arxiv.org/abs/2405.04517

它通过自监督学习方法在大量无标签的图像数据上进行训练，从而学会识别和理解图像内容。

论文地址：

https://arxiv.org/pdf/2405.01469

可以自动识别视频中的中文语音并根据语音内容裁剪视频。用户可以选择文本片段或说话人进行视频剪辑，未来还将支持英文视频剪辑。

项目地址：

https://github.com/alibaba-damo-academy/FunClip