アカウント名:
パスワード:
例えば、英語だと、a の発音として、4,5種類の「アー」「オゥ」「アェ」みたいなのがあるし。日本語だと、「あ」系は全部「あ」。 ヒンディーだと、子音の t だけで、舌の位置とか息遣いで四種類あるし。 中国語にいたっては、四声で意味が変わるので、読みようが無い気がする。
ただ、意外と日本語っ
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
最初のバージョンは常に打ち捨てられる。
ローマ字 (スコア:1)
例えば、英語だと、a の発音として、4,5種類の「アー」「オゥ」「アェ」みたいなのがあるし。日本語だと、「あ」系は全部「あ」。
ヒンディーだと、子音の t だけで、舌の位置とか息遣いで四種類あるし。
中国語にいたっては、四声で意味が変わるので、読みようが無い気がする。
ただ、意外と日本語っ
Re:ローマ字 (スコア:2, 参考になる)
ですから、音声認識では、多量の音のデータから表記に対応する音のバリエーションを抽出するという逆の方法を使っています。
そういった意味では、音声認識器は、実際の音をモデルとして記録しています。
日本語の場合は、表記と音の差がさほど大きくないですが、英語の場合はもっと差が大きいので、中間の(半)音節に変換しています。
まだ、トーンを含めた認識はあまりうまくはいっていないようですが、実はトーンが違うと音がかなり違うというのはありそうです。
ちなみに、中国語は4トーンですが、ベトナム語では6トーンらしいです。トーンの認識はずっと前から問題で、中国人が一生懸命研究しています。最近の研究はトレースしていないので、どうなっているかはわかりませんが。
tの問題は、舌の位置が違えば、音が違うので区別可能です。問題は、有気か無気の違いになりますが、これも実際にはかなり音が違っている可能性が高いです。そういえば、有気でも呼気と吸気で違う音であるとする言語が存在するそうです。