Skip to content

PPL异常 #32

@2020zyc

Description

@2020zyc
Image
  1. 测试如第一个红框的中文,使用generate函数进行输出,看起来不太通顺(第二个红框)
  2. 还是第一个红框的中文,使用model(input_ids)获得outputs,通过outputs里的logits与input_ids(label)一起计算ppl,达到170多。相同的方法,之前测试deepseek r1才3点几。
  3. 测试代码如下图
Image

请问以上现象是正常的吗,第一个问题是需要template?第二个问题,不管加不加template,都是100多,这太高了?
麻烦帮忙看有一下,谢谢!@zRzRzRzRzRzRzR

Metadata

Metadata

Labels

No labels
No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions