今日简讯 2024.5.12
- OpenAI将于美西时间5月13日上午10点(北京时间14日凌晨1点)拉开其春季更新活动的帷幕,通过线上直播的形式,向全球演示ChatGPT和GPT-4更新的功能。
- 微软公司周日宣布,将在法国投资 40 亿欧元(IT之家备注:当前约 311.6 亿元人民币),这笔投资将在 2027 年之前进行。
- 中美将举行人工智能政府间对话首次会议,交流科技风险及全球治理等问题。
- 马克·扎克伯格表示,长期的GPU荒已经基本结束,而是将面临能源问题的挑战,功耗将限制 AI 增长。
- 英国推出开源免费的 AI 模型安全评估平台Inspect,向全球 AI 工程师免费开放。
- 研究测试:AI 以 3-0 击败人类在道德图灵测试中。
- 研究人员使用AI技术鉴别eBay上的艺术品,发现多达40件赝品。
- 美国教授用 2 岁女儿训 AI 模型登 Science,人类幼崽头戴相机训练全新 AI。
- Anthropic 上周更新自家服务政策,允许第三方将自家 Claude 等 AI 模型用于“未成年人产品”中。
- 甲骨文推出 Oracle Code Assist 编程助理,可用 AI 写 Java 程序。
- 字节跳动收购OWS公司大十科技Oladance,有望推出AI智能眼镜。(放一个开源项目Open Glass AI,它可以20美元就能把任何眼镜改装成AI眼镜。)
地址:
https://github.com/BasedHardware/openglass
李开复旗下 AI 公司零一万物发布千亿参数闭源模型 Yi-Large
他表示 Yi-Large 的多数指标可对标甚至是超越 GPT 4.0。该模型在斯坦福大学最新的 AlpacaEval 2.0 评估中,全球大模型胜率(Win Rate)排第一、文本长度误差的胜率(LC Win Rate)排第二。推荐这篇访谈内容《对话李开复:这次大模型创业,我十年都不会变现》
港科大开源「文字跳动」技术,给文字动画注入语义灵魂!
研究人员提出了一种全新自动化文本动画方案「文字跳动」,实现了文本与动画的完美融合。1. 根据用户的描述,字母将被变形从而传达文本语义。2. 变形的字母将被赋予用户描述的生动动态效果,从而达成文字动画。
项目地址:
https://animate-your-word.github.io/demo/
研究人员推出 xLSTM 神经网络 AI 架构
Sepp Hochreiter 在 arXiv 上发布论文,提出了一种名为 xLSTM(Extended LSTM)的新架构,号称可以解决 LSTM 长期以来“只能按照时序处理信息”的“最大痛点”,从而“迎战”目前广受欢迎的 Transformer 架构。
论文地址:
https://arxiv.org/abs/2405.04517
能够对胸部X光片进行全面分析并识别常见疾病的视觉模型
它通过自监督学习方法在大量无标签的图像数据上进行训练,从而学会识别和理解图像内容。
论文地址:
https://arxiv.org/pdf/2405.01469
阿里巴巴开源一款视频自动化视频剪辑工具
可以自动识别视频中的中文语音并根据语音内容裁剪视频。用户可以选择文本片段或说话人进行视频剪辑,未来还将支持英文视频剪辑。
项目地址:
https://github.com/alibaba-damo-academy/FunClip