在測試語音識別的過程中,衡量識別內(nèi)容的準確性,一般通過如下指標進行評估
WER(WordErrorRate,詞錯率)
定義:為了使識別出來的詞序列和標準的詞序列之間保持一致,需要進行替換、刪除或者插入某些詞,這些插入、替換或刪除的詞的總個數(shù),除以標準的詞序列中詞的總個數(shù)的百分比,即為WER
WER=(S+D+I)/N
S:substitution,替換
D:Deletion,刪除
I:Insertion,插入
N:標準詞序列中詞的總個數(shù)
(S+D+I)=識別出來的詞序列與標準的詞序列之間的編輯距離
注意:因為有插入詞(Insertion),所以可能會出現(xiàn)WER>1的情況,不過,WER>1時,表明識別出來的詞序列和標準的詞序列相差很大,識別效果特別差
SER(SentenceErrorRate,句錯率)
定義:句子中如果有一個詞識別錯誤,那么這個句子被認為識別錯誤,句子識別錯誤的個數(shù),除以總的句子個數(shù)即為SER
SER=SE/N
SE:識別出來的序列中,識別錯誤的句子個數(shù)(即WER!=0的句子個數(shù))
N:標準序列中總句子個數(shù)
(2)、驗證識別內(nèi)容的準確性
統(tǒng)計識別文字的WER、SER指標
(3)、關注語音識別耗時
①短語音的識別耗時
②長語音的識別耗時
更多詳情可聯(lián)系藍亞技術工作人員:Benson
手機/Mob:(+86)13632500972
郵箱/E-mail:marketing@cblueasia.com