BluemixでWatosonAPIを使ってみた
今回は、Bluemixの100以上あるサービス・APIの中で最も人気の高いものの1つである「WatosonAPI」の紹介です。
WatsonAPI
WatsonAPIと一口に言っても、「画像認識」「音声認識」など様々な機能のAPIが提供されています。沢山ありますが、その中からイメージがつきやすく、シンプルなAPIを紹介します。
Text to Speech
名前のとおり、入力されたテキストの内容を読み上げてくれます。
適切な抑揚をつけてくれる、とのことで、読み上げソフトに多いぎこちなさが少なくなっています。
言語はいくつか対応していますが、日本語(女声)もありました。
読み上げる文章によっては、人間と変わらなく聞き取れます。
Speech To Text
先ほどの逆で、人間の声を文字列に変換します。日本語も対応しています。
デモを試した感じでは、思った以上に上手く文字列に変換されていました。
音声を単純に聞き取るだけでなく、聞き取った後、その前後の文章によってテキストを選びなおす、といった作業をしているため、
ちょっと声が遠かったり、滑舌が悪くてもある程度は聞き取ってくれます。
ですが、逆に前後の脈絡のない文章は少し苦手なようです。
AlchemyAPI
説明には、
「AlchemyAPI のサービスをご利用になることで、企業や開発者は Web ページ、ニュース記事、およびブログに含まれるテキストのコンテンツとコンテキストを理解するアプリケーションを構築することができます。」
とあります。
AlchemyAPIにはその中にいくつか種類があり、
「AlchemyLanguage」(文章の分析。日本語はまだ対応しておらず)
「AlchemyData News API」(ニュース記事の検索)
があります。以前はこれに加え、
「AlchemyVision」(画像分類)
「AlchemyVision Face Detection/Recognition」(顔の認識)
もあったのですが、AlchemyVision は拡張Visual Recognition サービスの一部として提供されることになったようです。
Visual Recognition
「画像コンテンツに含まれる意味を検出します。 イメージの場面、対象物、顔、テキスト、その他のコンテンツを分析します。」
こちらは画像認識のサービスで、顔の検出・性別・年齢層、その画像の種類、などを分析します。
以下はデモの様子ですが、レゴのような物でも顔部分がきちんと認識されていますね。
Tone Analyzer
使用方法には以下のように書かれています。
「Tone Analyzer サービスの用途はさまざまです。例えば、E メール・メッセージを送信前に分析したり、顧客へのプレゼンテーションやコミュニケーションの内容を実行前に分析したり、ブログ投稿が読者に与えるイメージを確認したり、テキスト・ベースのコミュニケーションで言葉の選択がどんな影響を及ぼす可能性があるかを把握したりすることなどができます。」
Eメールが失礼になっていないかのチェックや、会社等で発信している情報がどんな風に伝わるか等、色々と使い道がありそうです。
残念ながらまだ英語にしか対応していませんんが、これからに期待です
Personality Insights
テキストから、筆者の性格を推定します。
3500語以上、理想的には6000語以上の長さのテキストを渡すことが勧められています(日本語の場合、2~3文字で一語)。
https://personality-insights-livedemo.mybluemix.net/
こちらのデモサイトでは、twitterから自分の性格を分析などできます。
ぜひ試してみましょう。
ここで紹介したものは一部ですし、さらにこれらを組み合わせるなど、様々な応用ができそうです。