简介
gpt-prompt-engineer 是一个帮助研究与工程团队系统化提示工程的工具。它根据用户描述与测试用例生成候选提示,自动进行测试并使用 ELO 等机制对提示进行排序,从而发现质量更高的提示方案。
主要特性
- 自动生成多种候选提示并批量测试。
- 基于 ELO 的排序机制对提示效果进行评估与排名。
- 支持多种模型后端(GPT 系列、Claude 等)和 WandB/Portkey 的可选日志集成。
使用场景
- 需要系统化探索提示的研究与工程场景。
- 构建高效的 prompt 库以提升应用质量和鲁棒性。
- 进行分类任务或生成任务的提示优化与对比实验。
技术特点
- 基于 Notebook 的工作流(支持 Jupyter / Colab),便于实验复现。
- 可扩展的测试用例与评估流程,支持自动化基准测试。
- 依赖轻量,专注于实验探索而非生产部署。