Skip to content

ご視聴ありがとうございました の扱い #2

@akjava

Description

@akjava

現状

  • ご認識で、ご視聴ありがとうございました"となる テーブルがある。
  • 大抵、エラー 1.0となり、エラーレートを大幅に上げる。
  • MER/PERは無意味なものになる
  • ほとんどが、普通の音声の場合が多く、なぜ認識できなかったのか不思議に思う。
  • ラベルの品質向上のエラーレート順にソートすると上位に出てくることになる

詳細

FasterWhisperは、音声認識に失敗すると、"ご視聴ありがとうございました"となる。

音声がまったくない、空とは別の場合が多い。そのためVadの判定ではひっかからない。

6600件中、10件ほど、これになった。

jyakoTenでは、音声認識できなかった証として、テキストはこのままでいいが、
エラーレートには含めないほうがいいのではと思う。

重要なのは品質不明ということ、この音声をトレーニングに含めるかどうかは、人間が聞いてみないとわからない。
数が多ければ、自動で削除でもかまわないけど

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions