今日简讯 2024.5.11
- 彭博社记者马克・古尔曼(Mark Gurman)今日发文表示,苹果即将与 OpenAI 达成协议,为今年的新 iOS 系统提供一些生成式 AI 功能(如聊天机器人)。
- 微信读书上线AI问书功能,长按正文可检索分析文章。AI问书功能基于电子书内容整理和分析,提供准确答案和出处链接,带来知识之间的关联和拓展。
- 李彦宏在内部颁奖活动中强调了百度对技术的信仰和未来展望,肯定了文心一言的发展,称已有10%的大搜流量通过文心一言模型生成。
- OpenAI正准备展示一种革命性的人机对话技术,结合声音和文本,具备识别物体和图像能力。
- 由多方企业和机构组成的日本联合研究团队昨日发布了 Fugaku-LLM 大模型。(Fugaku-LLM 模型参数规模为 13B,是日本国内最大的大型语言模型。)
OpenAI 将于太平洋时间 5 月 13 日 10:00 (北京时间 5 月 14 日凌晨 1:00)网络直播一些关于 ChatGPT 的升级内容
- Sam Altman 在 X 平台转发了上述消息,并确认下周一不会发布 GPT-5,也不会发布 AI 搜索引擎。他还表示:“我们一直在努力开发一些我们认为人们会喜欢的新东西,对我来说感觉就像魔法一样。”
- Autodesk最新展示了名为Project Bernini的AI生成模型,可以将文本或图像转化为3D模型。
- 研究表明人工智能(AI)系统已经学会了如何欺骗人类即使这些系统被训练成有益和诚实的。
AniTalker:又一个可通过照片加音频生成说话视频的项目(开源)
AniTalker将静态照片和音频转换成动态说话视频,包括口型同步、面部表情和头部动作匹配。精细捕捉说话时的面部微动态,增强动画真实感,支持生成长视频超过3分钟。
论文地址:
https://x-lance.github.io/AniTalker/
Phi-3 WebGPU:允许用户直接在浏览器本地运行Phi-3模型
Phi-3WebGPU是一款由Xenova提供的AI模型,允许用户在浏览器中本地运行AI模型,结合了Transformers.js和onnxruntime-web,提供私密且高效的AI体验。
模型地址:
https://huggingface.co/spaces/Xenova/experimental-phi3-webgpu
Anthropic 推出两大新功能:自动生成提示与变量功能
自动生成提示功能通过AI直接生成合适的提示内容,用户可编辑定制;变量功能允许插入外部信息,创建动态提示。
体验地址:
https://claude.ai/
分享一个新的换脸工具(有免费试用)
支持图片和视频,视频最长支持60秒。可以玩一下~看下我的脸替换效果……
体验地址:
https://faceswap.so/
企业自动化、RPA、人工智能和代理全景图
提示词:https://musesai.io/prompt-detail/1175