読者です 読者をやめる 読者になる 読者になる

KINECT SDK + Speech Platformでの音声認識を色々と試してみる

KINECT SDKとSpeech Platformを利用すると日本語での音声認識ができるようです。

Kinect SDK と Speech Platform 11 で日本語の音声認識をする - かおるんダイアリー

そこで、どんな言葉なら認識されるのか色々と試してみました。

ChoicesにAddした言葉 SpeechRecognizedが発行された読み方 備考
F# - "しゃーぷ"ではだめ?
C++ しーぷらすぷらす,しーぷらぷら,し−,てぃー 誤認識が多い
ジャイアント馬場 じゃいあんとばば
ガッツ石松 がっついしまつ
ウマドンナ うまどんな
東京特許許可局 とうきょうとっきょきょかきょく
ガンダムッ!! がんだむ "がんだーむ!"とかでもいける
Test Driven Development てすとどりぶんべろっぷめんと 日本語発音でも認識される
月日は百代の過客にして行かふ年も又旅人なり つきひははくたいのかかくにしていきかうとしもまたたびびとなり 息継ぎなしで言わないとだめのようだ
月日は百代の過客にして、行かふ年も又旅人なり。 つきひははくたいのかかくにして、いきかうとしもまたたびびとなり。 読点部分でほんの少しだけ息継ぎする暇がある
月日は百代の過客にして、行かふ年も又旅人なり。 げつにちはももよの〜 漢字は音訓両対応みたい?
C++テンプレートメタプログラミング - "+"がシビア…
C++ テンプレートメタプログラミング しーぷらすぷらすてんぷれーとめたぷろぐらみんぐ 半角空白を入れると認識率上昇
Unityではじめるゲームづくり ゆにてぃ なぜUnityだけで…
Unity ではじめるゲームづくり ゆにてぃではじめるげーむづくり 半角空白をいれると全部言わないとだめ
鼻メガネの、鼻メガネによる、鼻メガネのための新年会 はなめがねの(以下略)
こんにちはーありがーとーさよならーまたあいましょー こんにちはーありがーとーさよならーまたあいましょー あたしんちOP「さらば」みたいなノリでも大丈夫な模様
Every day I listen to my heart ひとりじゃない えぶりでーあいりっすんとぅーまいはーとひとりじゃない 歌のノリでいける模様
じゅげむ じゅげむ - 全角空白はだめっぽい
じゅげむじゅげむ じゅげむじゅげむ こちらは問題ない
TDD てぃーでぉーでぃー
シャイニングフィンガー (ドモンのように叫びながら)しゃいにんぐふぃんがー 叫んでも大丈夫なのか…ほんとかよ
  • 似たような単語とかだとご誤認識率が上がる模様
  • 全角空白は入力として受け付けない
  • 残念な発音でも認識される
  • 漢字は音訓両対応の可能性あり
  • 読みを片方に固定したい場合はひらがなで入力すべき
  • 文字数が多すぎると入力として受け付けてもらえなくなるかも(要検証)
  • 英単語+日本語をきちんと認識させたいなら半角空白をいれたほうがよさげ?

KINECT用のRuntime Languagesというわけではないので誤認識は仕方ないのですかね。
あと、文章も大丈夫みたいですがあまり多様しないほうがいいのかもしれません。


最後に一つ。
音声認識は、周りに人がいない時か羞恥心を捨てたときに試すのが無難だと思います。