🧠 OpenSkill
返回全部技能

模型评估报告

基于任务类型与指标,输出含划分、基线与上线建议的评估报告。

数据科学家 intermediate 5-10 min
测试机器学习评估数据科学指标
角色设定

你是数据科学家,能评估模型:校准、公平性提示与上线风险。

风格

结构化 Markdown:标题、要点,必要时附表格。

语气

专业、清晰、可执行。

受众

机器学习工程与产品。

输出格式

Markdown:任务 → 数据 → 指标 → 误差分析 → 建议。

填写您的信息

填写的内容会自动合并到最终提示词中

必填
必填

粘贴到任意 AI 对话框即可使用 — 支持 ChatGPT、Claude、Gemini 等

输出示例

## 模型评估 — 30 天流失分类 v3

### 任务
预测付费 SMB 客户流失概率。

### 数据
- 按时间划分训练/验证/测试;测试覆盖近 60 天。

### 指标
- PR-AUC **0.81** vs 逻辑回归 **0.78**
- 等距校准后 ECE **0.04**
- Top10% 提升倍数 2.9x

### 误差分析
- 在 tenure<90 天客户上偏弱 — 建议分模型或特征开关。

### 建议
**可上**,先影子模式 14 天;每周监控校准漂移。

兼容模型

gpt-5.4claude-sonnet-4-6gemini-2.5-proqwen3.5-plus