語音識別要考慮語境

我現在用的是搜狗輸入法小米版,我覺得這個輸入法比較好用,但也稱不上完美。我經常用這個輸入法的語音輸入,從我的使用經歷中我發現一些這個輸入法的一些運行規律。比如說你經常使用的詞會在顯示中增加權重,這也就使用戶的用戶體驗越來越好。在你說某個詞時,它會根據大數據給你匹配這個音用戶使用最多的詞語。但它還是有值得優化的地方,我之所以這樣說是因為它經常表現一些幼稚的行為。

舉一個具體表現它幼稚的例子我現在一時想不出來,但我可以講一下它表現出幼稚行為的原因。我用語音識別輸入了半句話:xxxxxx。在這半句話最後還差一個詞,然後我用語音輸入法輸入這個詞,因為這個詞是相同的音有兩三個不同漢字的詞,輸入法結果是給出了我錯誤的詞。為什麼輸入法會出現這樣的錯誤?這是因為輸入法沒有考慮前半句,而是單單考慮了這個音在所有用戶使用的詞的頻率語音識別要考慮語境。解決這個問題的方法是在輸入法的算法中加入考慮前面的句子,也就是說前面的句子在語音識別中也佔有一定的權重。

希望這個建議對研發輸入法的研發人員能有一定的啟發。

相關推薦

推薦中...