PromptEnhancer 是一个用于文本到图像生成提示重写的工具,它在保留原始意图的同时重构提示结构,使提示更清晰、分层并具逻辑性,从而提升下游图像生成模型(如基于 Hunyuan 的模型)的效果。项目提供可配置的生成参数和示例模型(Hugging Face 上有模型发布),并附有技术报告与数据集。
主要特性
- 基于链式思维(global–details–summary)策略重写提示,强调主次信息分层
- 保留意图的同时进行解析与清理,支持输出解析与回退策略
- 可配置的推理参数(temperature、top_p、max_new_tokens)以平衡确定性与多样性
- 提供模型权重与评估数据集(如 PromptEnhancer-32B、T2I-Keypoints-Eval)
使用场景
- 提升文本到图像生成质量的预处理步骤
- 在创意生成、广告、概念艺术等场景中增强提示表达力
- 与图像生成流水线集成以获得更稳定、一致的输出
技术特点
- 主要实现:Python,依赖 Hugging Face 生态与本地模型加载(support trust_remote_code)
- 提供示例代码与快速启动说明,模型可从 Hugging Face 下载并本地推理
- 附带技术报告(arXiv)与公开评估数据集,便于学术与工程复现