今日简讯 2024.6.14
- 字节跳动“扣子 Coze”公众号今日宣布,扣子平台上线“模型广场”功能,提供了一个大模型匿名打 PK 的“擂台”。
- Adobe 本周四上调了 2024 财年的收入预期,因为在经济放缓的迹象下,越来越多的企业和消费者开始使用其 AI 驱动的编辑工具。
- 苹果公司和OpenAI达成协议,将ChatGPT集成到苹果设备中,具有里程碑意义,但苹果不会支付现金给OpenAI,认为将OpenAI的品牌和技术推广到数亿台设备中的价值等同或更高于金钱支付。
- Spotify成立内部创意机构Creative Lab,旨在帮助品牌定制营销活动并测试生成式AI广告。
- OpenAI在官网宣布,美国陆军退役四星上将、前美国网络司令部司令、前国家安全局局长、前中央安全局局长,Paul M. Nakasone(中曾根)加入董事会和安全委员会。
- 一天最高产出 7000 篇谣言扰乱公共秩序,江西一 MCN 机构用 AI 造谣被曝光。
对口型视频模型PROTEUS可让图片开口唱歌
斯坦福大学与Apparate Labs联合推出的AI模型PROTEUS实现了通过单张照片生成逼真虚拟人物,并实时唱歌和说话的功能。
地址:
https://apparate.ai/stream.html
美图的一键生成AI视频短片的工具也来了
Moki是美图公司推出的AI短片创作工具,专注于辅助视频创作者打造动画短片、网文短剧、故事绘本和音乐视频(MV)。
体验地址:
https://www.moki.cn/
可以轻松制作各种纹理炫酷字体效果的技术
FontStudio是一个创新的字体效果生成模型,它利用自适应扩散技术,能够在不规则的字体形状画布上生成连贯一致的视觉内容。
项目地址:
https://font-studio.github.io/
上传视频可根据指令实时识别解读视频内容
VideoLLaMA 2 是一个针对视频理解任务优化的大规模语言模型,它通过先进的空间-时间建模和音频理解能力,提升了对视频内容的解析和理解。
项目地址:
https://github.com/DAMO-NLP-SG/VideoLLaMA2
一款名为Musashi的“肌骨结构人形机器人”会自己开车
东京大学的研究人员最近发表了一篇技术论文,说他们的“肌肉骨骼仿人”机器人“武藏”已经能驾驶汽车了!
论文地址:
https://arxiv.org/pdf/2406.05573