扬帆,启航!- 我封面图的工作流-AIGC慢周刊Vol.1@20230625_环球报资讯
2023-06-26 21:40:14 来源:哔哩哔哩
卷首语
想持续看到内容,可微信和邮件免费订阅我的newsletter:/
【资料图】
创刊号的卷首,我先来简单介绍下我自己,以及为什么做这个newsletter。
6岁那年,家里有一副竹制的猛虎下山图水墨画,我拿着毛笔和宣纸临摹了无数遍,最后把最满意的一副挂在了客厅。6岁的小人怎么就会喜欢上水墨呢?我也不清楚。就是喜欢。可是我没有走上绘画的路。
初中时接触了星际争霸,组了战队,拿了奖金,那时想做大做强呀,便自学了网页制作,用网站招募队员,给杂志投稿写战报。那时呀学的还是frontpage+ftp,没点年岁的人可能都不知道这个。后来才过度到用Dreamweaver。结果呢,没有做大做强,只是小打小闹。从那时起就有了EVA剑心这个id。这个id中英文结合,很奇怪对吧,还很不好念。但我一直没有去掉,其实就源于当时的战队叫EVA。那是梦开始的地方,不能忘。
再后来有了魔兽争霸3,做了网站编辑,做了补丁包。终于正式走上了游戏媒体这条路,一做就是11年,很幸运,有了些成绩,从小编辑做到了主编。认识了很多很多朋友。大半个游戏圈里有我帮衬过的,也有帮衬过我的,直到自媒体时代来临,游戏门户消失。一夜之间,所有游戏媒体人都面临何去何从的问题。
那年叫2016,我32岁,面临人生的一次重大抉择。在两个月的思考里,一直下不定决心,我是继续打工呢还是自己做自媒体创业?
7年后,环境比当时恶劣很多倍,同样的问题。但不同的是,我已快40。人生没有多少个十年呀。还能再打工几年?我想试试另一种选择。一种我自己热爱的,以后10年,20年能持续做下去的事情。
做了这么多年游戏媒体,我非常清楚,做内容是需要时间沉淀的,做个人品牌也是。怎样才能在这个适应期降低焦虑呢?那我得调低预期,可能很长一段时间,我都未必会达到现如今的收入水平。我可以降低物欲,投资自己。我也可以通过自己以往的经验做做项目补贴。这样我或许能活得更开心些。把自己当成一位1年级学生,就像当初一样,躬身入局,扬帆,启航!
这个刊物取名慢周刊,就是希望给大家分享AIGC长期有价值的内容。慢下来,感受新技术能为我们做什么。不贩卖焦虑。提供一种陪伴性的成长。所以在这里你不会看到新闻类的内容。同样的,AIGC也才刚开始起步,我只是一个人,可以通过这个周刊结交更多厉害的朋友一起交流甚至合作。愿意交流的可以加我微信nokenshin,注明:AIGC慢周刊。
我们就从开篇那两张配图说起
这篇文章的标题是《扬帆,起航!》,想到这个标题呢,是源于小时候玩《大航海时代》,冒险是男人的烂漫。
在写下卷首语的时候,我就想给开篇配上两张图,一张是水墨的一张是代表我重新出发的。水墨是因为我最早的喜爱。按照以往我可能会从网上找,但找配图吧,要找到符合你表达,且满意的配图是很花时间的。而且他还不唯一,以前不会画(就算会,自己画也太费时),只能将就。现在有ai了,那就干起来。
本次使用的是stable diffusion,需要安装的请看首篇文章/posts/2284862995924668416
到C站(需魔法上网)搜了一圈,有好几个,但要不是工笔的,就是伪水墨。只有墨心(/models/12597?modelVersionId=14856)是有写意风格的。
《墨心》—— 昔涓子《琴心》,王孙《巧心》,心哉美矣,故用之焉。本品由安吉吴仓石、兴化板桥先生、八大山人、山阴伯年等大师之大小写意作品辅以现代人物训练而成。辅以恰当之提示词,诵先贤尊号,襄古今并用之意,明雅俗共举之美。
《疏可走马》—— 字画疏处可以走马,密处不使透风。这是一个和墨心搭配使用的构图Lora, 一旦使用并再最前前置提示词后,就会采用较大面积留白的构图风格。可以在版本处找到他
注意事项:
CFG范围将会改变风格1~3 : 大小写意3~7 : 逐渐工笔
推荐基础模型为ChilloutMix、国风等
《墨心》的推荐Lora权重为以下
《疏可走马》推荐Lora权重为~1lora模型:在不修改SD模型的前提下,利用少量数据训练出一种画风/IP/人物,实现定制化需求,所需的训练资源比训练SD模型要小很多,非常适合社区使用者和个人开发者。
tips:玩模型一定要看作者的说明。可以减少很多研究的时间。
我的工作流:他是一个逐渐对模型和参数理解的过程。
我们先要想象一下我们要的画面是怎样的
把描绘词扔进SD,插件会翻译成英文
按照模型要求调整推荐参数
跑xyz脚本,直接用图理解各模型和参数的搭配,
挑选合适的模型和参数抽卡
选择你最满意的做配图
接下来我们一个个讲解
1.我们先要想象一下我们要的画面是怎样的
我们有两张图,以下是我想象中的。
一艘中国帆船准备出海,四周山清水秀
一艘中国帆船在海面上,迎风破浪
不需要太多修饰词,否则SD不一定能理解你的意思,越复杂的描绘实现难度越大。我们要先从简单练习开始。
2.把描绘词扔进插件中文输入框,插件会翻译成英文
正向词
shukezouma,shuimobysim, <lora:.7>,<lora:shukezouma_v1_1:>, A Chinese sailboat is ready to go to sea,Surrounding mountains and water show,
反向词
EasyNegative,(worst quality:2),(low quality:2),(normal quality:2),lowres,normal quality,(watermark:2),
别紧张,先看图,插件里有翻译,第三段就是我们的描述词。第二段就是我们点击lora模型出现的两个lora词。点击后是<lora:>这样的,里面的lora:MoXin-1是lora的名称,冒号后面的1是他的权重,这里我们根据模型推荐改成了。同理改掉第二个lora
第一段的两个词怎么来的呢?
我们回到墨心的模型下载页面,查看作者给的参考图,点击!出现正反向词,正向词里是不是出现了一些不是描述图片的词,再联系旁边的触发词,其实你就理解了,这里两个lora各用了一个触发词shukezouma,shuimobysim, 到这里,我们正向词就理解完了。同理,反向词方面
(worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, skin spots, acnes, skin blemishes, age spot, glans, (watermark:2),
作者给的参考图里有一堆,我们复制过来,用插件翻译一下,就可以理解。他其实是偷懒了
skin spots, acnes, skin blemishes, age spot, glans,
这几个其实是不需要的,他是用来画人物的。我们可以通过插件点击删除掉。留下必要的。
在我给的反向词里除了留下的,还多了一个EasyNegative,这个其实是个反向词包,他放在我们的\WebUI-UX\embeddings目录下,这里可加可不加,放在这里是想给大家讲一下embeding。简单讲就是每次你只需要写一个反向词包的名称,就包含了诸多反向词,而EasyNegative是一个较为万用的反向词包。ok,整理反向词也ok了。
tips:写词最好分段,描述画面的词,lora词,触发|效果|光影|质量,这3种词分开段落,这样修改起来方便,看起来也清晰明了。
3.按照模型要求调整推荐参数
这里一般我们只需要根据推荐,调整采样方式和cfg(数值越大,越会接近你的描述),这个lora因为比较特殊,我们设成了4,至于为什么写4,看完后面你就知道了。一般情况只需要默认值就可以。宽度调整是因为我要一个长方形的图。
总结一下,其实不是模型的推荐要求,一般全默认都没问题。所以大家不用看到一堆参数就头疼。
4.跑xyz脚本,直接用图理解各模型和参数的搭配
重点来了,要想快速理解一个模型,没有比看图理解更快速的了。
打开脚本,选择xyz plot,x,y,你就理解为行,列,z就是再建一个行,列表。这里我们要理解的是cfg不同参数,对于写意的变化,以及他搭配不同的大模型(checkpoint)究竟能出什么惊喜的效果。其实我们还能用z轴再看下lora的不同权重又是怎样的,但因为这样跑出来的图太大不好查看,我这里就放一张cfg和模型的。最后勾选保持种子随机,我是为了顺带抽卡,如果纯看对比,可以不勾选这个。点击生成:
从大图中细看可以看出,这种大写意肯定不是我需要的,从开始逐渐往工笔走,但还是水墨为主。而不同的大模型搭配也会有些许的风格变化,这里就根据我们自己的审美去选择和理解。
5.挑选合适的模型和参数抽卡
我的需求需要写意一些,最终我挑选了deliberate这个大模型,选择用4去抽卡。
关闭脚本,批次调成9,cfg调成4,点击生成。
为什么单批数量不调?因为我显卡显存不大,选择批次他每次就跑一张图不至于爆显存。只是等待的时间稍微久点而已。
6.选择你最满意的做配图
这个环节就看个人喜爱度了,自由选择。
放几张还不错的。
同样的方法做第二张图
这次不用限定在水墨风里,所以测试模型就成为重点,用xyz脚本跑出来自己选择。
最后分享下第二张图的promgt,这里推荐golden hour(每天日落日出时阳光铺洒大地的时间)这个词,渲染出来效果非常好。大家可能发现我写的词都不长,不会像网上分享的好多图,词很长一串,甚至很多都是重复的堆叠,其实这种做法很不好,基本都是复制粘贴,他们有些人根本不理解提示词对这个模型的意义。我们要学习的关键其实就是对于模型和提示词的理解。才能容易做出自己需求的图。
High detail,Perfect light,masterpiece,best quality, golden hour,A Chinese sailing boat on the sea,Welcoming the waves, Negative prompt: EasyNegative,watermark, Steps: 15, Sampler: DPM++ 2M Karras, CFG scale: 5, Seed: 3164970559, Size: 768x512, Model hash: fd02a875a3, Model: , Version: ##
做管理太久,已经极少有机会到一线产出,写这篇效率也不高,还在逐渐恢复中,这期就先到这,等效率高了再提高产出。做newsletter是没有平台推荐机制的,如果觉得有价值,请帮忙分享给你的同好。想和我交流的底下评论,我每一条都会看的,我们下周见。
想持续看到内容,可微信和邮件免费订阅我的newsletter:/