三星的Galaxy Ring 智能戒指有点意思;附国内外AI产品6月数据

EchoMimic:音频+角色照片生成生动配嘴型视频

提供角色图片和音频,根据说话音频或唱歌音频合成角色视频,自动匹配嘴型,同时支持指定表情参考视频(landmarks)来控制角色面部表情。适用于虚拟人场景。

项目地址:

https://badtobest.github.io/echomimic.html

三星电子推出全新的Galaxy Ring智能戒指

Galaxy Ring提供24小时全天候的健康监测,包括睡眠分析、心率监测和体温变化监测,帮助用户优化健康习惯。

地址:

https://www.samsung.com/us/rings/galaxy-ring/

OpenAI最新在开发者Playground中增加了文本转语音API

开发者只需输入文本消息,选择预设声音即可生成音频,无需繁琐的语言和国家版本选择。

地址:

https://platform.openai.com/playground/tts

FoleyCrafter:让无声视频瞬间拥有逼真配音

通过提供视频和文字描述即可生成所需声音效果。能做一些场景音效,我记得之前elevenlabs.io也有类似直接根据文本做对应音效的产品。

项目地址:

https://foleycrafter.github.io/

斯坦福推可浏览网络生成长达几万字长篇文章的智能研究助手

STORM 2.0,该系统具有多项实用功能,包括浏览网络生成长篇文章、转化文献为连贯文章、自动生成问题等。

项目地址:

https://github.com/stanford-oval/storm

Midjourney  最新进展汇报

7月10日,Midjourney Office Hours公布了一些重要信息:将开始将Discord房间与网站房间同步个性化,正在努力发布下一个版本的个性化,并进行更好的个性化测试v6.5。可能会推出一些版本,例如先发布alpha版本进行测试。同时,可能会推出一个简化的超级放松模式,以及进行深度控制网络的测试。对于3D功能持乐观态度,但需要时间开发。视频模型也在制作中,但需要更高标准,制作人手较少。

原文地址:

https://x.com/aliejules/status/1811120952081588388

AI产品数据(6月)榜单

全球总榜:

全球高速增长的:

全球新品高增速:

国产:

国产高增速:

数据来源:

https://zw73xyquvv.feishu.cn/wiki/UH5QwtUWtis1gTk4R6rcnWK2nZc?chunked=false

相关推荐

  • 点线面的智慧: 转转JTS技术如何塑造上门履约地理布局
  • 实现LLM应用的可观测,难在哪里?
  • JetBrains IDE全系列采用新的默认“皮肤”:即将面向所有用户提供
  • 谁该有“金融羞耻感”?
  • 5年融资87亿,苏州明星独角兽要IPO了
  • 腾讯和去哪儿网官宣两件大事,上热搜了!
  • CVPR'24 Highlight|一个框架搞定人物动作生成,精细到手部运动
  • ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star
  • 这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于「视力」测试
  • GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了
  • 18个月326项能力,这家大厂猛猛上新生成式AI,如今纯靠Prompt就搞定企业级应用了
  • 微软宣布放弃OpenAI观察员席位,苹果也将搁置,反垄断见效?
  • 全现金!6.65亿美刀!AMD大手一挥收购欧洲最大私人AI实验室
  • DeepMind CEO称AI智力不如猫!LeCun持相同看法!曝光谷歌新项目AI将突破聊天限制
  • 魔改Transformer!9种提速又提效的模型优化方案
  • XGBoost和LightGBM时间序列预测对比
  • AI 正在取代工作岗位、ChatBot 进入厌倦期、向量数据库崛起,人工智能现状报告有这些重要发现!
  • 万字巨制!阿里、百度、腾讯、字节、蚂蚁等 9 大技术专家同台,“卷”出 AI 编码新未来
  • 程序员凭一己之力自研浏览器,挑战Chrome:GitHub联合创始人力挺,投百万美元支持!
  • 微软放弃在 OpenAI 董事会的观察员席位