提示词版本A:
请总结以下文本的主要观点...
提示词版本B:
作为一位专业编辑,请分析并提炼以下文本的核心论点...
评估指标:
1. 摘要质量
2. 关键信息保留率
3. 表达清晰度
// 对抗性输入测试
1. 包含错误信息的输入
2. 模糊不清的指令
3. 矛盾的要求
4. 不完整的上下文
graph LR
A[初始版本] --> B[收集反馈]
B --> C[分析问题]
C --> D[调整提示词]
D --> E[测试效果]
E --> F[部署更新]
错误类型 | 可能原因 | 优化方向 |
---|---|---|
输出不相关 | 上下文不足 | 补充必要信息 |
格式错误 | 约束不明确 | 添加明确的格式要求 |
内容重复 | 指令歧义 | 优化指令清晰度 |
响应过长 | 限制不足 | 添加长度约束 |
interface PromptTest {
input: string;
expectedOutput: string;
metrics: {
accuracy: number;
relevance: number;
clarity: number;
};
}
const testCases: PromptTest[] = [
{
input: "测试用例1",
expectedOutput: "期望结果1",
metrics: {
accuracy: 0.95,
relevance: 0.9,
clarity: 0.85
}
}
// ...更多测试用例
];