剑侠AI · ideogram文生图整合包(Lite 轻量版)
二、整合包介绍
本整合包由剑侠君独立制作,基于 ComfyUI 底层工作流,搭配自研「剑侠 UI」可视化
界面封装,专为 Windows 用户打造,实现零配置、开箱即用的本地 AI 绘图工具。
整合包已预装完整 Python 运行环境、CUDA 版 PyTorch、ComfyUI 主程序及全套必备
插件,用户无需手动安装 Python、Anaconda、CUDA 开发工具等依赖组件。
解压后双击根目录「剑侠启动器.exe」,即可启动 ComfyUI 算力后台(8188 端口)
与剑侠 Gradio 界面(7860 端口),支持内嵌窗口、系统浏览器两种模式,可直接完成
Ideogram 文生图、图像提示词反推、图片高清修复等核心功能。
本 Lite 轻量版主打 Ideogram 文生图及常用辅助能力,轻量化、低门槛、易上手。
界面内置预置正向 / 反向提示词,新手无需从零写词即可快速试出第一张图。
如需老照片修复、精细化修图、动漫转真人等进阶功能,可升级完整版:
https://www.jianxiaym.com/post/29.html

三、整合包核心特色
1. 绿色便携:内置独立 python 目录,解压即用,不污染系统环境。
2. 剑侠 UI:中文可视化界面,左右分栏卡片布局,工作流已预配置,无需手动画节点。
3. 四功能合一:顶部标签切换「ideogram文生图全精度」「ideogram文生图量化版」
「图像提示词反推」「图片高清修复」。
4. 预置提示词:文生图页内置正向 / 反向提示词下拉菜单,一键填入,覆盖不叠加,
降低新手写词门槛(详见下文「预置提示词功能」)。
5. 双精度文生图:全精度 safetensors 与 GGUF 量化版两套工作流,按显存自由切换。
6. 低显存优化:GGUF 量化 Unet、LoRA 启停调节、SeedVR2 BlockSwap、VAE 分块等。
7. 多模式启动:内嵌窗口、系统浏览器、仅 ComfyUI 三种启动方式。
8. 本地离线输出:生成结果默认保存至 ComfyUI\output,全程本地运算。

四、整合包详细功能
(一)启动器菜单
[1] 剑侠UI· 内嵌窗口(推荐)
[2] 剑侠UI· 系统浏览器
[3] 仅 ComfyUI 工作流(不启动剑侠 UI)
[0] 退出
命令行直启:剑侠启动器.exe --mode 1|2|3
────────────────────────────────────────
(二)Ideogram 文生图 · 全精度版
· 正向 / 反向提示词自定义,支持预置词下拉一键填入
· 正向框默认为空,显示占位提示「请输入需要生成的提示词...」
· 宽高比、调度器、步数、降噪、K 采样器等参数可调
· 双 Unet 全精度加载,LoRA1(正向)/ LoRA3(负向)默认开启
· LoRA2(正向)/ LoRA4(负向)默认关闭,可按需手动启用
· CLIP / VAE 模型选择与刷新
· 可选 SeedVR2 高清放大(目标分辨率 / 最大分辨率)
· 默认主模型:ideogram4_fp8_scaled.safetensors
· 默认负向模型:ideogram4_unconditional_fp8_scaled.safetensors
(三)Ideogram 文生图 · 量化版
· 参数面板与全精度版一致,含预置正向 / 反向提示词下拉
· 使用 GGUF 量化 Unet,更省显存,适合 8~12GB 显卡
· 默认主模型:ideogram4-Q4_0.gguf
· 默认负向模型:ideogram4_uncond-Q4_0.gguf
(四)预置提示词功能(全精度 / 量化版均支持)
在「① 基本输入区」,正向与反向提示词输入框下方各有一个下拉菜单:
【预置正向词】
· 下拉仅显示中文标题,选中后整框覆盖填入正向提示词(不叠加)
· 含「清空正向词」选项
· 内置 23 组示例,涵盖:人像、风景、海报、汽车、创意艺术等题材
· 完整文案可参考根目录《示例提示词.txt》
【预置反向词】
· 下拉仅显示中文标题,选中后整框覆盖填入英文反向提示词(不叠加)
· 含「清空反向词」选项
· 内置 12 组 Ideogram4 专用反向词:精简通用、通用完整、人像、风景、
城市、汽车、产品、美食、动漫、室内、动物、夜景等

使用建议:
· 新手:先选一条「预置正向词」试跑,再选对应题材的「预置反向词」
· 量化版 / 低显存:反向词优先选「精简通用」
· 选定后可继续在输入框内手动微调,不影响生成流程
(五)图像提示词反推
· 上传参考图,填写指令文本
· Qwen3-VL 视觉语言模型,可调温度与种子
· 一键反推提示词,支持复制结果,可用于文生图创作
· 默认模型:Qwen3-VL-4B-Instruct-FP8(以界面刷新列表为准)
(六)图片高清修复
· 上传待放大图片
· 缩放算法、scale_by 预处理
· DIT / VAE 模型选择与刷新
· 目标分辨率、批次、保存文件名前缀
· SeedVR2 图像放大管线
────────────────────────────────────────
(七)核心模型存放路径
大模型(Unet / DiT):ComfyUI\models\diffusion_models\
SeedVR2 模型: ComfyUI\models\SEEDVR2\
LoRA: ComfyUI\models\loras\
VAE: ComfyUI\models\vae\
文本编码器 / CLIP: ComfyUI\models\text_encoders\
输出目录: ComfyUI\output\

五、设备配置要求
(一)操作系统
· Windows 10 / 11(64 位)
(二)推荐配置
· 显卡:NVIDIA 独显 12GB+(RTX 3060 12G、4070、5070 等)
· 内存:16GB+(推荐 32GB)
· 硬盘:预留 60GB+ 可用空间,优先 SSD
· 驱动:保持 NVIDIA 驱动较新(无需单独安装 CUDA Toolkit)
(三)最低可尝试
· 显存 8GB:优先使用「ideogram文生图量化版」,反向词选「精简通用」
· 图像反推:Qwen3-VL-4B 量化版门槛相对较低
· 不推荐:GTX 10 系 6GB 及以下、无独显
(四)显存与模型参考
模型 建议显存
──────────────────────────────────────
ideogram4_fp8_scaled(全精度) 12GB+
ideogram4-Q4_0.gguf(量化) 8~12GB
qwen3vl_8b_fp8_scaled 与文生图共用 CLIP
seedvr2_ema_7b-Q8_K_M.gguf 12GB+
seedvr2_ema_7b-Q4_K_M.gguf 8GB+
Qwen3-VL-4B-Instruct-FP8 8GB+(反推)
说明:文生图为分段运行,OOM 时可切换量化版、降低分辨率与批次,或换更低 Q 模型。
(五)免安装组件
· 系统 Python、pip、Anaconda、CUDA Toolkit、单独部署 ComfyUI 均不需要

六、使用注意事项
1. 解压密码:jianxiaym.com(见《关于模型存放路径说明(必看).txt》)
2. 请勿修改 ComfyUI\.python\ 目录内核心文件,否则可能导致界面异常。
3. 请勿删除 python\、ComfyUI\ 等运行必需目录。
4. 建议解压至空间充足目录,路径不宜过深,尽量避免特殊字符。
5. 首次启动加载模型较慢,「运行中」属正常现象。
6. 切换标签后页面空白,请重启启动器。
7. 生成图片保存在 ComfyUI\output\,文件名前缀可在界面自定义。
8. 使用 VPN/代理时,请确保 127.0.0.1 不走代理。
9. 整合包仅供学习与技术交流,商用须自行承担合规责任(见《AI合规使用声明.txt》)。
10. Ideogram4 内置安全过滤,若出现灰色「Image blocked by safety filter」
拦截图,属模型行为而非整合包故障(详见第七节「Ideogram 安全过滤说明」)。
七、快速使用指南 & 参数建议
(一)快速上手
① 解压整合包(输入解压密码)
② 双击「剑侠启动器.exe」,选 [1] 内嵌窗口或 [2] 浏览器
③ 等待 8188 / 7860 端口就绪
④ 进入「ideogram文生图全精度」或「量化版」标签
⑤ 在「预置正向词」选一条示例,在「预置反向词」选对应题材
⑥ 按需微调参数,点击开始生成
⑦ 在「本次输出」预览,或到 ComfyUI\output\ 查看原图
(二)Ideogram 文生图建议
· 首次使用:预置正向词 +「精简通用」反向词,默认参数即可试跑
· 8~10GB 显存:用量化版标签,关闭 SeedVR2
· 12GB+ 显存:可用全精度版,需要更清晰时再开 SeedVR2(2048 较稳)
· 想自己写词:正向框直接输入,预置下拉选「清空」或不操作即可
· LoRA:默认仅 LoRA1 + LoRA3 生效,一般无需改动
(三)Ideogram 安全过滤说明(灰色拦截图)
若「本次输出」出现灰色竖条,中央写着:
Image blocked by safety filter
且界面状态显示「已完成」,说明生成流程已正常跑完,并非剑侠 UI 或整合包报错。
【原因】
· 这是 Ideogram4 模型权重内自带的内置安全机制,ComfyUI / 剑侠 UI 无法关闭
· 模型认为当前提示词或生成结果可能违规时,会输出这张「拦截占位图」
· 纯文本(plain text)提示词误拦较常见,部分正常人像、商业描述也可能被拦
· 同一提示词换不同 seed,有时一次被拦、一次又能正常出图
【与整合包故障的区别】
· 安全拦截:日志正常、状态「已完成」,output 目录里也是同一张灰图
· 真正故障:ComfyUI 未连接、显存 OOM、节点报错、界面长时间「运行中」无结果
【处理建议】
① 勾选「随机噪波」,换 seed 多试几次
② 改写正向提示词,避免易误触表述(如将「成熟女性」改为「女性模特、商业肖像」)
③ 先用「风景 / 产品 / 海报」类预置正向词试跑,确认模型本身可正常出图
④ 全精度版与量化版可互换尝试
⑤ 反向词一般不是主因,保持「精简通用」或对应题材即可
【说明】
· Ideogram 官方更推荐 JSON 结构化 caption,plain text 误拦率相对更高
· 当前剑侠 UI 输入框为普通文本模式,后续版本可考虑增加 JSON 模板支持
· 请勿将此类拦截视为整合包损坏;若持续无法出图,可换题材或调整表述后再试

(四)图像提示词反推
· 上传主体清晰的参考图
· 指令尽量具体(风格、光影、构图、质感等)
· 温度偏低更稳定,偏高更有变化
(五)图片高清修复
· scale_by 默认 0.5,可按原图微调
· 常用:目标分辨率 2048、最大 4096
· 显存紧张时降低批次与目标分辨率
(六)常见问题
· 出现灰色 Image blocked by safety filter:见上文「Ideogram 安全过滤说明」
· ComfyUI 未连接:确认已选 [1]/[2],等待 8188 就绪后点「刷新模型」
· 显存 OOM:换量化版、精简反向词、降分辨率 / 批次
· 模型列表为空:检查 models 子目录,再刷新模型列表
· 反推无输出:确认已上传图片并填写指令,检查 Qwen3-VL 模型
八、版权与免责声明
本整合包及相关 UI、工作流配置归剑侠君所有。使用者须遵守国家法律法规及
《AI合规使用声明.txt》中的规定,因违规使用产生的一切后果由使用者自行承担。
===============================================================
剑侠源码网 · https://www.jianxiaym.com/ · 整合包作者:剑侠君
===============================================================



评论列表(暂无评论)
还没有评论,来说两句吧…