-
Notifications
You must be signed in to change notification settings - Fork 0
Open
Description
現状
- ご認識で、ご視聴ありがとうございました"となる テーブルがある。
- 大抵、エラー 1.0となり、エラーレートを大幅に上げる。
- MER/PERは無意味なものになる
- ほとんどが、普通の音声の場合が多く、なぜ認識できなかったのか不思議に思う。
- ラベルの品質向上のエラーレート順にソートすると上位に出てくることになる
詳細
FasterWhisperは、音声認識に失敗すると、"ご視聴ありがとうございました"となる。
音声がまったくない、空とは別の場合が多い。そのためVadの判定ではひっかからない。
6600件中、10件ほど、これになった。
jyakoTenでは、音声認識できなかった証として、テキストはこのままでいいが、
エラーレートには含めないほうがいいのではと思う。
重要なのは品質不明ということ、この音声をトレーニングに含めるかどうかは、人間が聞いてみないとわからない。
数が多ければ、自動で削除でもかまわないけど
Metadata
Metadata
Assignees
Labels
No labels