模型名称 | ernie_vilg |
---|---|
类别 | 图像-文图生成 |
网络 | ERNIE-ViLG |
数据集 | - |
是否支持Fine-tuning | 否 |
模型大小 | - |
最新更新日期 | 2022-10-14 |
数据指标 | - |
-
输入文本 "戴眼镜的猫" 风格 "油画"
-
输出图像
文心ERNIE-ViLG参数规模达到100亿,是目前为止全球最大规模中文跨模态生成模型,在文本生成图像、图像描述等跨模态生成任务上效果全球领先,在图文生成领域MS-COCO、COCO-CN、AIC-ICC等数据集上取得最好效果。你可以输入一段文本描述以及生成风格,模型就会根据输入的内容自动创作出符合要求的图像。
-
-
paddlepaddle >= 2.0.0
-
paddlehub >= 2.2.0 | 如何安装PaddleHub
-
-
-
$ hub install ernie_vilg
- 如您安装时遇到问题,可参考:零基础windows安装 | 零基础Linux安装 | 零基础MacOS安装
-
-
- 请前往 文心旸谷社区 申请使用本模型所需的 API key 和 Secret Key。
-
-
# 请设置 '--ak' 和 '--sk' 参数 # 或者设置 'WENXIN_AK' 和 'WENXIN_SK' 环境变量 # 更多细节参考下方 API 说明 $ hub run ernie_vilg --text_prompts "宁静的小镇" --style "油画" --output_dir ernie_vilg_out
-
-
-
import paddlehub as hub # 请设置 'ak' 和 'sk' 参数 # 或者设置 'WENXIN_AK' 和 'WENXIN_SK' 环境变量 # 更多细节参考下方 API 说明 module = hub.Module(name="ernie_vilg") text_prompts = ["宁静的小镇"] images = module.generate_image(text_prompts=text_prompts, style='油画', output_dir='./ernie_vilg_out/')
-
-
-
def __init__( ak: Optional[str] = None, sk: Optional[str] = None )
-
初始化 API。
-
参数
- ak(Optional[str]): 文心 API AK,默认为 None,即从环境变量 'WENXIN_AK' 中获取;
- sk(Optional[str]): 文心 API SK,默认为 None,即从环境变量 'WENXIN_SK' 中获取。
-
-
def generate_image( text_prompts:str, style: Optional[str] = "探索无限", topk: Optional[int] = 6, output_dir: Optional[str] = 'ernievilg_output' )
-
文图生成API,生成文本描述内容的图像。
-
参数
- text_prompts(str): 输入的语句,描述想要生成的图像的内容。
- style(Optional[str]): 生成图像的风格,当前支持 古风、油画、水彩、卡通、二次元、浮世绘、蒸汽波艺术、 low poly、像素风格、概念艺术、未来主义、赛博朋克、写实风格、洛丽塔风格、巴洛克风格、超现实主义、探索无限。
- topk(Optional[int]): 保存前多少张图,最多保存6张。
- output_dir(Optional[str]): 保存输出图像的目录,默认为"ernievilg_output"。
-
返回
- images(List(PIL.Image)): 返回生成的所有图像列表,PIL的Image格式。
-
-
作者:佳祥 (LCL-Brew) & 单斌
「公式」= 图片主体,细节词,修饰词 细节词可以任意组合,修饰词可以限定一种风格,也可以限定多种风格,遵循的基本原则是符合正常的中文语法逻辑即可。
prompt:蒙娜丽莎,赛博朋克,宝丽来,33毫米, 蒸汽波艺术 |
prompt:火焰,凤凰,少女,未来感,高清,3d, 精致面容,cg感,古风,唯美,毛发细致,上半身立绘 |
prompt:巨狼,飘雪,蓝色大片烟雾,毛发细致, 烟雾缭绕,高清,3d,cg感,侧面照 |
prompt:浮世绘日本科幻哑光绘画,概念艺术, 动漫风格神道寺禅园英雄动作序列,包豪斯 |
好的修饰词可以让图片生成的效果更好,基于产业级知识增强的文心大模型,用户可以通过输入独特且特征明显的修饰词,来达到更高质量的图片生成。
cg感
厚涂风格 / 厚涂版绘
古风
精致面容
穆夏 / 穆夏风格
机械感 / 机械
宫崎骏动画
烟雾 / 烟雾缭绕
皮克斯动画
拟人化
剪纸叠加风格
色彩斑斓
城市印象 & 圆形轮廓
上半身立绘 / 人物立绘
电影质感
扁平化设计 / 扁平化
logo设计 / 简约logo设计
细节清晰
毛发细致
复古未来主义风格 ->- 海滩兔风格 ->- 抽象技术风格 ->- 酸性精灵风格 ->- 古埃及风格 ->- 风帽风格 ->- 装饰艺术风格 ->- 极光风格 ->- 秋天风格 ->- 巴洛克风格 ->- 摩托车手风格 ->- 碎核风格 ->- 纸箱风格 ->- 未来主义风格 ->- 孟菲斯公司风格 ->- 立体主义风格 ->-赛博朋克风格 ->- 黑暗自然主义风格 ->- 表现主义风格 ->- 野兽派风格 ->- 鬼魂风格 ->- 嘻哈风格 ->- 嬉皮士风格 ->- 幻象之城风格 ->- 印象主义风格 ->- 卡瓦伊风格 ->- 美人鱼风格 ->- 极简主义风格 ->- 水井惠郎风格 ->- 苔藓风格 ->- 新浪潮风格 ->- 迷宫物语风格 ->- 仙女风格 ->- 粉彩朋克风格 ->- 照片写实风格 ->- 粉红公主风格 ->- 海盗风格 ->- 像素可爱风格 ->- 波普艺术风格 ->- 史前遗迹风格 ->- 迷幻风格 ->- 雨天风格 ->- 湿漉漉的风格 ->- 浮世绘风格 ->- 矢量心风格 ->- 维京人风格 ->- 女巫店风格 ->- 后印象主义 ->- 素人主义
艺术类型 | 艺术家 | 常用艺术风格 |
---|---|---|
肖像画 | 文森特·梵高 | 印象主义 |
风景画 | 尼古拉斯·罗伊里奇 | 现实主义 |
风俗画 | 皮埃尔-奥古斯特·雷诺阿 | 浪漫主义 |
宗教绘画 | 克劳德·莫内 | 表现主义 |
抽象画 | 彼得·孔查洛夫斯基 | 后印象主义 |
都市风景画 | 卡米尔·毕沙罗 | 象征主义 |
素描与草图 | 约翰·辛格·萨金特 | 新艺术主义 |
静物 | 伦勃朗 | 巴洛克风格 |
裸体画 | 马克·夏加尔 | 抽象表现主义 |
插画 | 巴勃罗·毕加索 | 北欧文艺复兴 |
古斯塔夫·多雷 | 素人艺术,原始主义 | |
阿尔布雷特·丢勒 | 立体主义 | |
鲍里斯·库斯妥基耶夫 | 洛可可 | |
埃德加·德加 | 色域绘画 | |
波普艺术 | ||
文艺复兴开端 | ||
文艺复兴全盛期 | ||
极简主义 | ||
矫饰主义,文艺复兴晚期 |
可以加入到Prompt 中的摄影词 | |
---|---|
浅景深 | 仰拍 |
负像 | 动态模糊 |
微距 | 高反差 |
双色版 | 中心构图 |
角度 | 逆光 |
三分法 | 长曝光 |
抓拍 | 禅宗摄影 |
软焦点 | 抽象微距镜头 |
黑白 | 暗色调 |
无镜反射 | 长时间曝光 |
双色调 | 框架,取景 |
颗粒图像 |
- 【作图规则】Prompt构建是文本符合逻辑的组合,有序且丰富的描述可以不断提升画面效果
- 【新手入门】不知如何输入Prompt?点击示例,体验文生图的魅力,参考教程,逐步进阶~
- 【风格生成】试试添加 “国潮”、“国风”等,感受中国风的魅力
- 【风格生成】试试混合两种代表性的风格,例如“赛博朋克,扁平化设计”、”皮克斯动画,赛博朋克”
- 【人像生成】添加“仙鹤、月亮、楼阁、小屋、街道、玫瑰、机械”,画面会更饱满
- 【人像生成】添加“精致面容、唯美、cg感、细节清晰“等,人物刻画会更细致
- 【风格生成】添加“扁平化风格,logo”等,可以设计出各类图标等,例如 “猫猫头像,扁平化风格”
- 【风格生成】指定颜色,或添加“烟雾缭绕”、“火焰”、“烟尘”、“花瓣”,生成画面的氛围感更饱满
- 【创意生成】发挥想象力,例如:“中西混搭”、“泰迪熊唱京剧”、“米老鼠吃火锅”
- 【风格生成】“水彩”,“水墨”与古诗组合,画面意境会有提升~
- 【风格生成】想要日系头像和拟人化动物?试试关键词“日系手绘”、“治愈风”
- 【风格生成】添加“pixiv”,生成二次元或者动漫的画质更惊艳
利用AI技术生成图片的最终目的是要便捷地为人类创造美的作品,激发人的想象力和创作力。而技术在发展中,做不到十全十美,不能保证每次生成的图片都能够尽善尽美。因此呼吁所有用户,您想分享满意的AI图片时,请以正能量进行传播宣传! 算法生成的图片难免会受到数据的影响,从而导致生成的图片是有数据偏见的。因此在分享AI生成图片到社交媒体之前,请谨慎评估当前的图片是不是含有:令人不适的、暴力的、色情的内容。如对以上的内容进行恶意传播,您将会承担相应的法律后果。
美学相关的词汇: https://aesthetics.fandom.com/wiki/List_of_Aesthetics
DALL-E 2 的 Prompt 技巧资料:https://docs.google.com/document/d/11WlzjBT0xRpQhP9tFMtxzd0q6ANIdHPUBkMV-YB043U/edit
DiscoDiffusion Prompt 技巧资料:https://docs.google.com/document/d/1l8s7uS2dGqjztYSjPpzlmXLjl5PM3IGkRWI3IiCuK7g/edit
-
PaddleHub Serving可以部署一个在线文图生成服务。
-
-
运行启动命令:
-
$ hub serving start -m ernie_vilg
-
这样就完成了一个文图生成的在线服务API的部署,默认端口号为8866。
-
NOTE: 如使用GPU预测,则需要在启动服务之前,请设置CUDA_VISIBLE_DEVICES环境变量,否则不用设置。
-
-
-
配置好服务端,以下数行代码即可实现发送预测请求,获取预测结果。
-
import requests import json import cv2 import base64 from io import BytesIO from PIL import Image # 发送HTTP请求 data = {'text_prompts': '巨大的白色城堡'} headers = {"Content-type": "application/json"} url = "http://127.0.0.1:8866/predict/ernie_vilg" r = requests.post(url=url, headers=headers, data=json.dumps(data)) # 获取返回结果 for i, result in enumerate(r.json()["results"]): image = Image.open(BytesIO(base64.b64decode(result))) image.save('result_{}.png'.format(i))
-
-
从paddlehub 2.3.1开始支持使用链接 http://127.0.0.1:8866/gradio/ernie_vilg 在浏览器中访问ernie_vilg的gradio app。
-
1.0.0
初始发布
-
1.1.0
增加分辨率参数以及所支持的风格
-
1.2.0
移除分辨率参数,移除默认 AK 和 SK
-
1.3.0 新增对gradio app的支持
$ hub install ernie_vilg == 1.3.0