EchoMimic:音频+角色照片生成生动配嘴型视频
提供角色图片和音频,根据说话音频或唱歌音频合成角色视频,自动匹配嘴型,同时支持指定表情参考视频(landmarks)来控制角色面部表情。适用于虚拟人场景。
项目地址:
https://badtobest.github.io/echomimic.html
三星电子推出全新的Galaxy Ring智能戒指
Galaxy Ring提供24小时全天候的健康监测,包括睡眠分析、心率监测和体温变化监测,帮助用户优化健康习惯。
地址:
https://www.samsung.com/us/rings/galaxy-ring/
OpenAI最新在开发者Playground中增加了文本转语音API
开发者只需输入文本消息,选择预设声音即可生成音频,无需繁琐的语言和国家版本选择。
地址:
https://platform.openai.com/playground/tts
FoleyCrafter:让无声视频瞬间拥有逼真配音
通过提供视频和文字描述即可生成所需声音效果。能做一些场景音效,我记得之前elevenlabs.io也有类似直接根据文本做对应音效的产品。
项目地址:
https://foleycrafter.github.io/
斯坦福推可浏览网络生成长达几万字长篇文章的智能研究助手
STORM 2.0,该系统具有多项实用功能,包括浏览网络生成长篇文章、转化文献为连贯文章、自动生成问题等。
项目地址:
https://github.com/stanford-oval/storm
Midjourney 最新进展汇报
7月10日,Midjourney Office Hours公布了一些重要信息:将开始将Discord房间与网站房间同步个性化,正在努力发布下一个版本的个性化,并进行更好的个性化测试v6.5。可能会推出一些版本,例如先发布alpha版本进行测试。同时,可能会推出一个简化的超级放松模式,以及进行深度控制网络的测试。对于3D功能持乐观态度,但需要时间开发。视频模型也在制作中,但需要更高标准,制作人手较少。
原文地址:
https://x.com/aliejules/status/1811120952081588388
AI产品数据(6月)榜单
全球总榜:
全球高速增长的:
全球新品高增速:
国产:
国产高增速:
数据来源:
https://zw73xyquvv.feishu.cn/wiki/UH5QwtUWtis1gTk4R6rcnWK2nZc?chunked=false