图片会开口唱歌,机器人也会自己开车了

今日简讯 2024.6.14

- 字节跳动“扣子 Coze”公众号今日宣布,扣子平台上线“模型广场”功能,提供了一个大模型匿名打 PK 的“擂台”。

 Adobe 本周四上调了 2024 财年的收入预期,因为在经济放缓的迹象下,越来越多的企业和消费者开始使用其 AI 驱动的编辑工具。

苹果公司和OpenAI达成协议,将ChatGPT集成到苹果设备中,具有里程碑意义,但苹果不会支付现金给OpenAI,认为将OpenAI的品牌和技术推广到数亿台设备中的价值等同或更高于金钱支付。

Spotify成立内部创意机构Creative Lab,旨在帮助品牌定制营销活动并测试生成式AI广告。

OpenAI在官网宣布,美国陆军退役四星上将、前美国网络司令部司令、前国家安全局局长、前中央安全局局长,Paul M. Nakasone(中曾根)加入董事会和安全委员会。

一天最高产出 7000 篇谣言扰乱公共秩序,江西一 MCN 机构用 AI 造谣被曝光。

对口型视频模型PROTEUS可让图片开口唱歌

斯坦福大学与Apparate Labs联合推出的AI模型PROTEUS实现了通过单张照片生成逼真虚拟人物,并实时唱歌和说话的功能。

地址:

https://apparate.ai/stream.html

美图的一键生成AI视频短片的工具也来了

Moki是美图公司推出的AI短片创作工具,专注于辅助视频创作者打造动画短片、网文短剧、故事绘本和音乐视频(MV)。

体验地址:

https://www.moki.cn/

可以轻松制作各种纹理炫酷字体效果的技术

FontStudio是一个创新的字体效果生成模型,它利用自适应扩散技术,能够在不规则的字体形状画布上生成连贯一致的视觉内容。

项目地址:

https://font-studio.github.io/

上传视频可根据指令实时识别解读视频内容

VideoLLaMA 2 是一个针对视频理解任务优化的大规模语言模型,它通过先进的空间-时间建模和音频理解能力,提升了对视频内容的解析和理解。

项目地址:

https://github.com/DAMO-NLP-SG/VideoLLaMA2

一款名为Musashi的“肌骨结构人形机器人”会自己开车

东京大学的研究人员最近发表了一篇技术论文,说他们的“肌肉骨骼仿人”机器人“武藏”已经能驾驶汽车了!

论文地址:

https://arxiv.org/pdf/2406.05573

相关推荐

  • TypeScript 进阶,深入理解并运用索引访问类型提升代码质量
  • 分享我低成本实现睡后收入的方法,新人也适合
  • 【第17讲】6月19日,AI智能体实战-第二期
  • 自学微积分,17岁的天才中专女生闯进全球数学竞赛12强
  • 网易二面:CPU狂飙900%,这怎么处理?
  • 苹果称Swift是取代C++的最佳选择
  • 从分销转向零售,TCL实业是如何考虑中台建设和数据库选型的?
  • 贝壳找房: 为 AI 平台打造混合多云的存储加速底座
  • Netflix 如何打造高可靠在线有状态系统
  • 喜发新模型,却被众嘲是破产“前兆”!Stability AI “最强”模型人形绘制太“阴间”,网友:因为研发太讲武德
  • AI 让编程效率提高 100 倍?顺丰用 AI 管理 40w 小哥?ArchSummit 深圳首日热点来袭
  • 被美国列入制裁“实体清单”的西工大——在开源处理器架构RISC-V中发现可远程利用的中危漏洞
  • 奇舞周刊第530期:AIGC和低代码结合应用全栈研发实践总结
  • 巨变时代,ToB软件行业如何穿越周期——2024一村资本主题沙龙活动圆满举办
  • VC集体退出茶颜悦色?
  • 140元,任何普通眼镜爆改AI助手,网友:《黑镜》成真
  • 大模型理解复杂表格,字节&中科大出手了
  • CVPR‘24全程满分+最佳论文候选!上交大港中文等提出神经场网格模型三大定理
  • 规格拉满!Llama和Sora作者都来刷脸的中国AI春晚,还开源了一大堆大模型成果
  • 又火一个惊艳的开源项目,诞生了!