Sora透露出一个重要的信号,可以预料,视频生成领域也正在积极探索统一的建模方式,构建新的通用模型。
并且,就像大语言模型也在通过逻辑、规划能力的增强来推进代码、协作、Agent方面的能力,大视频模型也将努力推进在复杂现实任务的执行能力,覆盖计算机视觉、嵌入式人工智能和科学领域的多个方面。
统一的视频模型——大视频模型可以执行多种视频相关的任务,并且相比大语言模型,在表征空间、物理、细节、动作等方面更加擅长,在全球的海量视频数据训练下,其潜力不可小觑。
例如,在智能汽车制造场景,仿真是很重要的部分,由于实验车的生产成本是量产车的10倍,因此仿真实验能带来很大的成本节省,大视频模型则有望进一步降低物理仿真的成本。
Sora目前生成的虚拟视频其实只是大视频模型的一小部分,在物理理解方面还很有限,真正的大视频模型,将是物理感知的。
秉持“数聚垂域,智领未来”信念,DataFunCon2024·上海站将继续顺应趋势,组织AI Agent、新数字娱乐等论坛,邀请数据智能技术专家、行业专家,交流大语言模型、视频生成等前沿话题的方方面面,与你共同探讨数据智能落地的现在与未来。
除上述内容外,本次活动共邀请了60+位行业专家经验分享,聚集了1000+技术从业者参与,在这里你可以做行业交流,生态合作,寻找投资机会,了解行业发展,了解落地案例,寻求解决方案,拓展人脉。
扫码咨询门票获取
议程详情