中国风?古典系?AI中文绘图创作尝鲜!⛵

稀土掘金 稀土掘金

中国风?古典系?AI中文绘图创作尝鲜!⛵

2022年12月20日 13:50 ·  阅读 4162
关注

💡 引言

人工智能图像生成器现在风靡一时。虽然 📘Dall-E2、 📘MidJourney和 📘Stable Diffusion目前处于中心舞台,但是百度开发的开源 AI 图像生成器 📘ERNIE-ViLG 也在互联网上流传。

💡 ERNIE-ViLG 是什么

ERNIE 代表通过知识整合增强表示——视觉语言生成。它是一个统一的生成预训练框架,用于使用 Transformer 模型进行双向图像文本生成。

需要明确的是,ERNIE 并不是 Stable Duffusion 的一个变体版本,尽管这两种模型都是开源的。根据 📘ERNIE论文,ERNIE-ViLG 2.0 是一种改进的文本到图像扩散模型,具有知识增强的去噪专家组合,以结合有关视觉场景的额外知识,并在不同步骤中解耦去噪能力。

💡 ERNIE-ViLG 使用方法

现在可以通过 huggingface 免费访问该模型。我们可以在 📘ERNIE-ViLG Demo 查看工具实例。

界面非常简单:可以看到经典的提示框,各种艺术风格的选择,以及图像分辨率。在艺术风格方面,ERNIE 提供了一些有趣的选择。这让我想起了 📘Dream by WOMBO 中的一个类似功能。

让我们用提示“An astronaut riding a horse in space”来生成样本。

该应用程序生成六张分辨率为 1024x1024 的图像。

ERNIE 的研究人员声称,他们的方法比 Dall-E2 和 Stable Diffusion 产生更清晰、更自然的细节。

真的吗?现在让我们尝试将艺术风格更改为“油画”。

这些结果本身都非常惊艳。

质量上,ERNIE 可以与 Dall-E2 和 Stable Diffusion 相媲美。但是,它在一致性方面表现不佳,就像在上面提到的,其中两个结果中的马无处可寻。这可能是训练ERNIE的数据集较小所致。

不过,如果仔细考虑数据集的大小,训练了 14.5 亿张图像的 ERNIE 与 MidJourney、Google Parti 等大型竞争对手的差距并不大。

也许开发人员找到了一种优化算法的方法,使其能够在较小的数据集上运行良好。我假设如果模型是在更大的数据集上训练的,现有的限制就会消失。

需要特别注意的是,ERNIE 是用中文开发的。这意味着,在开始图像生成过程之前,必须将英文提示翻译成中文。当然,使用中文的宝宝可以尽情玩耍~

这里有更多示例结果。

上图提示文字:“戴眼镜的猫”风格“油画”

上图提示文字:“五官端正的绘画女生”

💡 API 访问 ERNIE-ViLG

您可以通过 API 访问 ERNIE。如果您想尝试使用 API,请按照这个 📘GitHub 上的指南进行操作。

示例 API 调用如下所示。

def generate_image(
          text_prompts:str,
          style: Optional[str] = "探索无限",
          topk: Optional[int] = 6,
          output_dir: Optional[str] = 'ernievilg_output')
复制代码
  • text_prompts:输入提示
  • style :生成图像的风格
  • topk:生成图像的数量(最多 6 个)
  • output_dir:保存输出图像的目录

ERNIE 的使用指南还有一个建议列表,可帮助您找到结合使用样式和修饰符的最佳方式。

  • 【作图规则】Prompt构建是文本符合逻辑的组合,有序且丰富的描述可以不断提升画面效果
  • 【新手入门】不知如何输入Prompt?点击示例,体验文生图的魅力,参考教程,逐步进阶~
  • 【风格生成】试试添加 “国潮”、“国风”等,感受中国风的魅力
  • 【风格生成】试试混合两种代表性的风格,例如“赛博朋克,扁平化设计”、”皮克斯动画,赛博朋克”
  • 【人像生成】添加“仙鹤、月亮、楼阁、小屋、街道、玫瑰、机械”,画面会更饱满
  • 【人像生成】添加“精致面容、唯美、cg感、细节清晰“等,人物刻画会更细致
  • 【风格生成】添加“扁平化风格,logo”等,可以设计出各类图标等,例如 “猫猫头像,扁平化风格”
  • 【风格生成】指定颜色,或添加“烟雾缭绕”、“火焰”、“烟尘”、“花瓣”,生成画面的氛围感更饱满
  • 【创意生成】发挥想象力,例如:“中西混搭”、“泰迪熊唱京剧”、“米老鼠吃火锅”
  • 【风格生成】“水彩”,“水墨”与古诗组合,画面意境会有提升~
  • 【风格生成】想要日系头像和拟人化动物?试试关键词“日系手绘”、“治愈风”
  • 【风格生成】添加“pixiv”,生成二次元或者动漫的画质更惊艳

参考资料

分类:
人工智能
标签:
安装掘金浏览器插件
多内容聚合浏览、多引擎快捷搜索、多工具便捷提效、多模式随心畅享,你想要的,这里都有!
前往安装
收藏成功!
已添加到「」, 点击更改
  • 微信
    微信扫码分享
  • 新浪微博
  • QQ
沉浸阅读
温馨提示
当前操作失败,如有疑问,可点击申诉
前往申诉 我知道了

相关推荐

  • CUDA算法效率提升关键点概述
  • ChatGPT登上Time封面!这场竞赛,OpenAI赌赢了
  • 这是Meta版ChatGPT雏形?开源、一块GPU就能跑,1/10参数量打败GPT-3
  • 『AIGC』ControlNet在游戏产业中能做什么?
  • 借助免费AI艺术平台生成头像
  • 最佳实践|用腾讯云AI图像能力实现AI作画
  • 玩转GPT--在线文本生成项目[可入坑~科普系列]
  • 兔年了,利用AI风格化实现剪纸兔、年画兔、烟花兔
  • GPT、GPT-2和GPT-3概览
  • 从零开始学习机器学习
  • 为Kubernetes集群部署一个ChatGPT机器人
  • 当代年轻人养生现状 | 每日一冷
  • 靠大尺度,爆火全网!AI涉黄,竟是暴富密码?
  • 痛失又一个重大产业,日本人哭了
  • 俄乌冲突1周年,还要打多久?
  • 德国政界人士呼吁认真调查“北溪”被炸真相;拜登称打算竞选:被人质疑年龄完全合理;台枪击案两嫌犯自厦门被押解回台 | 每日大新闻
  • 不要运费、不要代购费,149抢美国C*stco网红爆款月亮椅!
  • 让《三体》从科幻片变成纪录片,怎么做?
  • 晚年为何不来华避难?穆沙拉夫:不想给中国添麻烦,我是争议人物
  • 中国开源社区健康案例——OpenHarmony社区