この広告は30日以上更新がないブログに表示されております。
新規記事の投稿を行うことで、非表示にすることが可能です。
広告
posted by fanblog
2019年01月27日
自然言語処理(COTOHA API)のアップデート(2019.01.15〜)
COTOHA
追加項目
公式サイト )
追加された項目は、次の4項目です。
2つは、音声認識システムへの導入を強く意識している機能に思えます。
残り2つは汎用的な機能と思います。
アレクサなど音声認識アプリケーション開発にも、応用が効いてくると思います。
1. 言い淀み除去(β版)
言葉が詰まって出てこない際に、発話する「ええと」や「あのう」といった表現を除去できる機能です。
入力した文字列から言い淀み表現が除去されます。
例えば、「ええと、明日の天気は晴れです。」と入力した場合、「ええと、」が言い淀み表現として検出することが可能となる機能です。
2. 音声認識誤り検知(β版)
音声認識したテキストデータに認識ミスがあるかを検出・抽出することができる機能です。
認識ミスと思われる単語を出力してくれる機能です。
今後、音声認識誤り訂正のAPIが追加予定ということなので、自動検出+自動訂正も一括で行うことが可能となるかもしれません。
3. 感情分析(正式版)
こちらは、正式版となった機能です。文章が表現している感情を「ポジティブ」「ネガティブ」と判定することができます。yahooのリアルタイム検索の画面で、感情判定をご覧になったことがある方もいると思います。
例えば、製品などのレビュー解析への応用が効くように思います。ユーザが何に不満を持っているか、何に利点を感じたかを自動的に解析できえます。
4. 照応解析(正式版)
いわゆる「こそあど言葉」のような指示語の検知と、それらの対象を特定することができます。
β版から正式版になったことで、複数形や複数単語にも対応可能になったようです。
リファレンスに例があるように、「太郎は友人です。彼はステーキを食べた。」という文を入力することで、「太郎=彼」と判定することが可能です。
終わりに
今回のアップデートで「音声認識」関連のAPIが追加され、音声認識の精度向上に力を入れていることが感じられます。Youtubeでも字幕表示がされますが、精度としては未だに見るに堪えない内容で、日本語の音声認識の難しさを感じてしまいます。
COTOHA APIの性能向上には期待をする限りです。
照応解析などを学ぶならば、このような本もおすすめです。
---
【関連記事】
・ 自然言語処理(COTOHA API)のご紹介
---
【更新履歴】
190127:新規作成
---