省流:在提示词的理解度以及画面的完成方面flux更胜一筹,
从图像的质量来看SD3.5更好(但是3.5不会画手)而且经常人体崩坏。
这两者进行结合也许能做出不错的图片,比如flux生图再经过3.5高清修复。
对比过程统一提示词
In a warm and comfortable bedroom, sunlight shines through the window onto the soft sheets, bringing a warm color to the entire room. There is a girl lying on the bed, immersed in the peaceful afternoon time, enjoying a moment of laziness. Her face appeared particularly soft under the sunlight, and her long eyelashes trembled gently, as if expressing her inner peace and tranquility.  ...
ComfyUI
未读下方表格为comfyUI快捷键及对应功能说明
快捷键
快捷键说明
Ctrl + Enter
将当前工作流程加入图像生成队列中
Ctrl + Shift + Enter
将当前工作流程作为第一个生图的加入到图像生成队列中
Ctrl + Z/Ctrl + Y
撤销/重做
Ctrl + S
保存工作流
Ctrl + O
加载(打开)工作流
Ctrl + A
选择全部节点
Alt + C
折叠/取消折叠所选节点
Ctrl + M
屏蔽/解除屏蔽当前工作节点
Ctrl + B
忽略选中的节点 (使对应节点不参与到生图中来)
Delete/Backspace
删除选中的节点
Ctrl + Delete/Backspace
删除当前工作流
Space
使用鼠标拖动画布
Ctrl/Shift + Click(点击)
把点击的节点加入到选中
Ctrl + C/Ctrl + V
复制和粘贴选中节点(不保持对应节点与其它未选定节点输出的连接)
Ctrl + C& ...
PowerShell和CMD是两种不同的命令行接口(CLI),它们在Windows操作系统中都用于执行命令和管理系统,但它们之间有几个主要区别
设计和功能:
PowerShell:
基于.NET框架设计,可以执行.NET对象。
提供了更强大的命令(称为cmdlet)和脚本功能。
支持面向对象的概念,允许使用管道将对象传递给其他命令。
有更完善的错误处理和数据操作能力。
支持复杂的查询和操作,如正则表达式。
CMD:
传统的命令行解释器,源自较早的MS-DOS。
命令通常比较简单,功能有限。
主要支持文本操作,而不像PowerShell那样支持对象操作。
错误处理和数据操作能力相对较弱。
语言和脚本:
PowerShell:
支持丰富的脚本语言,可以创建复杂的脚本。
提供了大量的内置命令(cmdlet)。
脚本可以包含复杂的逻辑和控制流结构。
CMD:
脚本通常使用批处理语言编写,功能较为基础。
命令数量有限,且功能较为单一。
兼容性:
PowerShell:
更好的与Windows管理框架(Windows Management Framework, WMF)集成。
 ...
很早就听说格式工厂偷偷拿用户的电脑挖矿,知道这件事后我不太信任它了,听说大部分音视频处理软件都是基于ffmpeg来封装功能,那我干脆研究一下ffmpeg的用法。
网上搜了一下找到一个博主的教程,这里我搬运一下,转载地址:
https://wklchris.github.io/blog/FFmpeg/FFmpeg.html
本篇主要展示我自己常用的内容。有用到再搬运,比如这次只用到了格式转换。
这是我将mkv容器的猫和老鼠视频转换为mp4容器的指令,
-c:v:指定视频(video)的编码器
h264_nvenc:编码,这意思是gpu和cpu混合运算
-c:a :表示音频(audio)编码器。
copy:表示流复制,这样不需要重新编码。
ffmpeg -i 01.mkv -c:v h264_nvenc -c:a copy 01.mp4
将文件转换为mp4文件并且设置质量系数(-crf或-cq 0-51越小质量越高)来降低文件大小
ffmpeg -i qixing.mp4 -c:v hevc_nvenc -preset medium -cq 18 -c:a copy output_ ...
这功能让你可以用更小的显存生成更大的图片,通过分块生成来节省资源。
效果好、效率高、可控性强
使用TiledDiffusion和Tiled VAE生成高清图片在图生图页面选择放大算法和倍数,其他参数看下图介绍。
实测我8g显存的3060tig6x显卡,可以直接生成4k图片,还是挺方便的,就是速度有点慢。(三分半)
细节方面跟原来文生图相比也丰富了不少。原图太大就不发出来了,放一张对比图:
文生图配合controlnet使用-Tile模型在以上的基础上在controlnet里找到分块,启用就行。
更改这个页面的方法
打开路径blog\themes\anzhiyu\layout\includes\page\
下的album.pug文件,里面就有需要更改的内容。
使用图生图制作战损版蒙德风格图片model:tPonynai3_v65
lora:Burning Building
使用Topaz Photo AI高清放大
展示
制作流程下载工作流
获取图片首先是上游戏进行截图,不使用游戏自带拍照软件是因为会有水印,不方便图生图。
直接使用原神的无ui模式,加上卡视角拍摄几张没有水印的1080p的图片。
图片处理有些图需要在特殊的部位涂上一些橙色作为火焰生成,我一般提前用ps涂抹,正好也能把uid遮了
提示词反推使用ComfyUI-MiniCPM-Plus节点反推提示词,效果还不错
它还有gpt扩写功能,不过我目前没使用过。
写提示词使用Load Lora Stacked with Previews (XTNodes)节点可以获取lora在c站的信息,我通常在这里参考关键词
将反推的提示词内容筛选一下有用的词条,再加上一些建筑倒塌、建筑着火等关键词
score_9, score_8_up, score_7_up, score_6_up,, medieval style, town scene, video game,  circula ...
electron
未读
 之前做了一个翻译软件专门用来实时翻译和提供提示词扩展,借助了智谱清言的智能体。
用了一段时间后发现还是有比较明显的缺陷。比如生成的文本没法直观地与原文对照。
碍于我py代码水平实在不咋样,改功能只能通过问ai,这样效率太低了。所以打算换成前端语言来重构。
electron是一个桌面端开发框架
electron打包包体大小基本都100m起步,毕竟每个软件都自带一个小浏览器。理论上来说我这种小工具不适合用electron开发。
功能需求
置顶
关键词翻译
鼠标选中输入的提示词时,会在结果页面高亮显示对应的翻译结果(或者相反)
Electron Fiddle因为我的需求只是做一个应用,所以根据官方推荐,安装了Electron Fiddle,直接能使用Electron。并且我看了下介绍这个也可以打包应用,那么有何不可呢。
官网:https://www.electronjs.org/fiddle
下载完直接双击就能打开
开发经过一晚上的拷打ai,终于完成了初步的效果实现。以下是代码
<!DOCTYPE html><html lang="en"> ...
ComfyUI
未读首先需要安装Topaz,我在up主的星球里直接一键下载了他给的整合包,在此分享。
注意解压的时候密码不要输错
T8star-Aix
视频在这:https://www.bilibili.com/video/BV1h8pieBEQQ/?vd_source=7aa5bcb5a7c34becbf26b1d712279ba8
里面详细介绍了使用方法。
值得一提的是这个工作流不适合放大锐化过多以及栅格化的图片。
up的整合包里提供了软件本体以及汉化包。使用节点的时候需要输入安装路径,然后就可以在工作流中调用。单独使用软件来放大效果会比工作流中使用效果更好。
原图
修复且放大后的图像(稍微调了色)








