奥特曼和老黄打起来了!Luma干的。。。

转自:量子位

发布不到2天,那个号称“下一代”文生视频的Dream Machine(来自Luma AI),大大大大翻车

原本宣传中的效果是这样的:

效果之惊艳,令人直呼“忘掉Sora”、“影视级水平”,并且Luma也是相当自信地表示“在线免费可玩”。

然而……当网友们纷纷前去尝鲜之后,得到的结果却是大跌眼镜。

例如给Dream Machine“投喂”一张OpenAI的一张合影:

结果它生成的视频是这样的:

是的,打起来了,而且人物的畸变也是相当离谱。

网友们也是忍俊不禁,调侃地说道:

我们终于知道去年OpenAI发生了什么。

再“投喂”一张奥特曼、老黄和Brockman的合影:

Dream Machine这次给出的结果是:

没错……又打起来了。

(Dream Machine好像很暴力的样子)

虽说Dream Machine生成视频的效果和剧情有些离谱,但爱整活儿的网友们却是坐不住了,直接开辟了一个新赛道

让表情包“活”起来

或许Dream Machine这种“不走寻常路”的风格,跟表情包的气质很搭,现在网友们更乐于让AI“续写”表情包:

AI让memes栩栩如生。

Luma的Dream Machine可以当成Meme Machine了。

例如这张非常经典的表情包,在Dream Machine的加持下,后续的故事就谱写出来了:

然而还有更drama的版本——顺手牵羊:

男主角还从一名白人直接变成了三哥……

我们经常用到的“狗头”表情包,也在Dream Machine之下活了起来:

还有“淡定姐”和“励志哥”:

不难看出,Dream Machine被网友们吐槽翻车的最大问题,就是在于无法保证视频内容的连续性。

尤其是在生成人物方面,前后帧直接变人种、变性别的概率比较高。

因此,也有网友建议:

使用Luma最好的方法,就是先用Midjourney这样的工具生成关键图片,然后再用Luma对其处理。

然而,说到AI翻车,Luma的Dream Machine并不是个例。

SD3开源也秒翻车

前两天Stable Diffusion 3开源的消息也是让不少的网友们兴奋了一把。

但在亲自体验过后,很多人却直呼离了大谱。

例如生成一个躺在草地上的女孩,结果“打开方式”是这样的:

而且不是个例,只要是和人(整体)相关的内容,生成结果都有点掉san。

虽然在生成其它方面SD3的效果还是能让人满意,但它和Dream Machine一样,总是处理不好人类。

有人发现,如果细看“躺在草坪上的女孩”这张图像,会发现它在局部细节上确实还可以,甚至很棒。

草地上的影子、衣物上反射的光线、头发的质地……都遵循了物理规律。

但人物整体就不敢恭维了。

不少网友都认为,这就是问题的关键。

我认为他们的NSFW过滤器,把所有人类图像都判定为了NSFW。

这个过滤器全称是filtering out adult content,作用在于过滤掉不合规的成人内容。

SD2发布时就出现过类似的问题,研究人员发现审查这部分内容可能影响了模型对人体结构的理解。

后面的SD2.1和SDXL版本在这一问题上有所缓解。

这次SD3的翻车,暴露了一个问题:过于严格的数据审核,可能误删了一些无害的成人图像,所以现在模型没法理解人体结构。

总而言之,无论是Dream Machine还是SD3等,AIGC应用工具还需要不断加强和完善。

不过若是对整活表情包感兴趣的小伙伴,现在就可以去试试了:

https://lumalabs.ai/dream-machine

·················END·················

推荐阅读

•   又火一个惊艳的开源项目,诞生了!

相关推荐

  • AlphaFold的伟大,只因做对了这5件事!DeepMind副总裁:团队注定会取得突破
  • 陶哲轩最新采访:AI将颠覆数学界!用Lean规模化,成百上千条定理一次秒杀
  • 英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!性能对标GPT-4o
  • 北航等提出超大规模多语言代码评测基准,涵盖40种编程语言
  • ACL 2024 | 多模态大模型能揭示图像背后的深意吗?
  • 惊呆!大模型工程师月薪快10w了!
  • 【第17讲】6月19日,AI智能体实战-第二期
  • 京东员工:年薪百万,到手很“虚”。一年存款只有4万块,日子很“穷”
  • 领域大模型的挑战与机遇:从构建到应用
  • Stanford发布501页全球AI指数报告:中美两国引领世界,但有一项中国不如印度(附报告全文)
  • 突发!Sam Altman与OpenAI股东正式提出公司转型,成为营利性公司!!
  • SIGGRAPH2024|上科大、影眸联合提出DressCode:从文本生成3D服装板片
  • 有望解决一个千禧年大奖难题,这个20多年前的猜想终于得到证明
  • 英伟达开源最强通用模型Nemotron-4 340B
  • 仅存活三个月的Copilot GPTs,因无盈利希望,被微软强制「退休」
  • 现在起,真正的强者敢于直面「扣子」的「模型广场」
  • Agent云服务,不止做平台|量子位·视点 x 汇智智能
  • AI画连环画角色更一致了!人物之间的复杂互动也能处理|中山大学&联想团队出品
  • 奥特曼和老黄动手了……Luma干的
  • 利用大模型进行知识图谱问答的交互式系统LinkQ:兼看中文OCR代表方案、Benchmark及数据合成工具