📚 构建长期复利型知识基础设施的指南,详见 RAG 实战手册

PromptEnhancer

基于链式思维(Chain-of-Thought)提示重写的工具,用于将文本提示重构为更清晰、有层次且逻辑一致的图像生成提示。

PromptEnhancer 是一个用于文本到图像生成提示重写的工具,它在保留原始意图的同时重构提示结构,使提示更清晰、分层并具逻辑性,从而提升下游图像生成模型(如基于 Hunyuan 的模型)的效果。项目提供可配置的生成参数和示例模型(Hugging Face 上有模型发布),并附有技术报告与数据集。

主要特性

  • 基于链式思维(global–details–summary)策略重写提示,强调主次信息分层
  • 保留意图的同时进行解析与清理,支持输出解析与回退策略
  • 可配置的推理参数(temperature、top_p、max_new_tokens)以平衡确定性与多样性
  • 提供模型权重与评估数据集(如 PromptEnhancer-32B、T2I-Keypoints-Eval)

使用场景

  • 提升文本到图像生成质量的预处理步骤
  • 在创意生成、广告、概念艺术等场景中增强提示表达力
  • 与图像生成流水线集成以获得更稳定、一致的输出

技术特点

  • 主要实现:Python,依赖 Hugging Face 生态与本地模型加载(support trust_remote_code)
  • 提供示例代码与快速启动说明,模型可从 Hugging Face 下载并本地推理
  • 附带技术报告(arXiv)与公开评估数据集,便于学术与工程复现

评论区

PromptEnhancer
资源信息
作者 腾讯
添加时间 2025-09-20
标签
开源项目 提示工程