Sora揭示视频生成的未来

Sora透露出一个重要的信号,可以预料,视频生成领域也正在积极探索统一的建模方式,构建新的通用模型。

并且,就像大语言模型也在通过逻辑、规划能力的增强来推进代码、协作、Agent方面的能力,大视频模型也将努力推进在复杂现实任务的执行能力,覆盖计算机视觉、嵌入式人工智能和科学领域的多个方面。

统一的视频模型——大视频模型可以执行多种视频相关的任务,并且相比大语言模型,在表征空间、物理、细节、动作等方面更加擅长,在全球的海量视频数据训练下,其潜力不可小觑。

例如,在智能汽车制造场景,仿真是很重要的部分,由于实验车的生产成本是量产车的10倍,因此仿真实验能带来很大的成本节省,大视频模型则有望进一步降低物理仿真的成本。

Sora目前生成的虚拟视频其实只是大视频模型的一小部分,在物理理解方面还很有限,真正的大视频模型,将是物理感知的。

秉持“数聚垂域,智领未来”信念,DataFunCon2024·上海站将继续顺应趋势,组织AI Agent、新数字娱乐等论坛,邀请数据智能技术专家、行业专家,交流大语言模型、视频生成等前沿话题的方方面面,与你共同探讨数据智能落地的现在与未来。

除上述内容外,本次活动共邀请了60+位行业专家经验分享,聚集了1000+技术从业者参与,在这里你可以做行业交流,生态合作,寻找投资机会,了解行业发展,了解落地案例,寻求解决方案,拓展人脉。

扫码咨询门票获取



议程详情



相关推荐

  • ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP
  • 全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA
  • Midjourney封禁Stability AI:恶意爬取数据,致服务器瘫痪24小时
  • Sora 时代的 AI 视频生成何去何从?
  • 想搞AI,高中别学数据科学:奥特曼、马斯克此刻终于一致了
  • 「还是谷歌好」,离职创业一年,我才发现训练大模型有这么多坑
  • 中科院等万字详解:最前沿图像扩散模型综述
  • 消费级显卡可用!李开复零一万物发布并开源90亿参数Yi模型,代码数学能力史上最强
  • 谷歌被曝翻车内幕:内部群龙无首,生图机制过分“多元化”
  • 马斯克Ilya私密邮件被Claude破译,OpenAI打码信息公开,谷歌很受伤
  • 人大系初创与OpenAI三次“撞车”:类Sora架构一年前已发论文
  • 程序员疯狂互爆每年薪资变化。
  • 今日arXiv最热大模型论文:哈工深新研究发现!无需额外资源,SelectIT方法助力大语言模型精准调优
  • Claude 3 相比 GPT-4 到底强在哪?我整理了一份总结
  • 好家伙!一个 Claude 3 约等于一个本科生...
  • 热搜第一!娃哈哈是高校实验室御用水,曾多次被写进论文里
  • 高校有哪些编制?哪些是高校“假编制”?
  • 急需有声配音员:对照文案阅读即可,地点、时间不限,不会可免费培训!
  • OpenAI公布重要邮件,反击马斯克起诉
  • 大模型与消费级GPU更配哦~|即将迎来"1-bit时代"