为什么 paper 里有 NQ, TriviaQA, PopQA, HotpotQA, 2Wiki... 之类的评估,但 repo 里只有 NQ 的评估数据集呢?
为什么 paper 里有 NQ, TriviaQA, PopQA, HotpotQA, 2Wiki... 之类的评估,但 repo 里只有 NQ 的评估数据集呢?