1. Learn
  2. /
  3. 课程
  4. /
  5. Python 中的 LLM 入门

Connected

道练习

使用 evaluate 指标

现在来评估用于分类客户支持对话的 LLM。基于您之前微调好的模型,您将使用一个新的验证数据集来评估模型表现。

部分交互内容及其对应标签已作为 validate_text 和 validate_labels 为您加载。model 和 tokenizer 也已加载。

说明

100 XP
  • 从 outputs 中的模型 logits 提取预测标签。
  • 通过比较真实标签(validate_labels)与预测标签,计算已加载的 4 个指标。