今日は前回の続きでAPI使ってみたいと思います
今回使うAPIは[音声認識API]です
今回もこちらのサイト参照で
docomoAPI
前回同様ファイル作ってサイトに載ってるコードかいてきます
APIKEYも入力して、音声データは前々回作ったやつ使い回し
で、実行!
・・・
全然へんてこりんな言葉返ってくる、、
ちゃんとサイトを読んでみる
音声データのフォーマットが16khz/16bitでないとダメみたい
前回作ったデータを見てみると
Signed 16 bit Little Endian, レート 44100 Hz, ステレオ
となっているのでレートを変えないといけないみたい
ただどうやるのかわからないので調べてみる
結果
arecord -f S16_LE -r 16000 -D hw:0,0 test.wav
これでやれば16khz/16bitになるっぽいよ
なんでこれでできるか詳しいことはわからん
調べてみてください
これで音声データ作ってpython実行!
できた!
ちゃんと言葉を認識してくれてます
おもしろい
では、今日も読んでいただきありがとうございました!