今日简讯 2024.5.15
IMF 总裁警告:AI 将对劳动力市场造成海啸般打击,影响全球四成岗位。
ElevenLabs最近发布了配音API,允许开发者在产品中添加音频或视频翻译功能。
百度 Apollo 今天在武汉百度萝卜快跑汽车机器人智行谷举办 Apollo Day 2024,发布了全球首个支持 L4 级自动驾驶的大模型 Apollo ADFM(Autonomous Driving Foundation Model)。
对轰 GPT-4o,谷歌推出 Astra 项目
在今天的Google I/O 2024开发者大会上,谷歌推出了以下产品和更新:
序号 | 产品/更新名称 | 描述 | 特点 |
---|---|---|---|
1 | TPU芯片Trillium | Alphabet发布的第六代张量处理器 | 速度是上一代的五倍,为生成文本和其他内容的技术提供动力 |
2 | Gemini 1.5 Pro模型 | 谷歌宣布的模型升级,支持200万tokens | 全面支持Workspace,面向全球开发者开放 |
3 | Project Astra | 通用AI代理,通过手机摄像头与用户交互 | 具有记忆和理解上下文的能力 |
4 | Veo视频生成大模型 | 生成超过一分钟时长的高质量1080p视频 | 代表用户的创意愿景 |
5 | Gemini Nano模型 | 将登陆Pixel手机的多模态模型 | 提供文字、图片、视频、音频的理解能力,具有隐私保护功能 |
6 | AI模型Gemma 2 | 新一代AI模型,多种尺寸和全新架构 | 优化部署成本,能在更少的计算资源上运行 |
7 | AI搜索功能更新 | 谷歌搜索整合AI技术,引入视频搜索功能 | 用户可以上传视频来展示需要解决的问题 |
8 | Android 15 | 提到的更新包括AI防诈骗、卫星通信支持等 | - |
9 | Google Photos新功能 | Ask Photos功能,模糊搜索照片和视频 | 利用Gemini模型 |
10 | Circle to search功能 | 圈出数学题获得解题帮助 | 使用Android设备 |
11 | Gemini手机AI助手 | 帮助用户识别并避免诈骗电话 | 识别典型的诈骗对话模式并警告 |
字节跳动豆包大模型掀起价格战,计价单位:厘
字节跳动旗下的火山引擎第一次正式亮相了豆包大模型家族,9个!“大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。豆包主力模型在企业市场的定价只有 0.0008 元 / 千 Tokens,0.8 厘就能处理 1500 多个汉字,比行业便宜 99.3%。”
地址:
https://www.volcengine.com/product/doubao
OpenAI 联合创始人兼首席科学家 Ilya Sutskever宣布离职
Ilya Sutskever 为前 OpenAI 董事会成员,曾推动罢免 OpenAI CEO 阿尔特曼 Sam Altman 的行动。目前离职的精英人士:
序号 | 姓名 | 职位/贡献 |
---|---|---|
1 | Ilya Sutskever | OpenAI联合创始人和研究主管 |
2 | Jan Leike | RLHF发明者之一,重要贡献者,超级对齐团队共同领导者 |
3 | Ryan Lowe | GPT-4项目对齐工作领导者 |
4 | William Saunders | 超级对齐团队成员 |
5 | Daniel Kokotajlo | GPT-4对抗性测试参与者 |
腾讯开源图像生成模型混元DiT
混元DiT提供双语生成能力,中国元素理解具有优势。混元DiT能分析和理解长篇文本中的信息并生成相应艺术作品。混元DiT能捕捉文本中的细微之处,从而生成完美符合用户需要的图片。
地址:
https://dit.hunyuan.tencent.com/