Cloud Vision API

AI用語集

AI用語集ではAIに関する用語を中心に
まとめています。
初めて聞く用語や、インターネットを使っていて
わからないことがあったときにお役立てください。

Cloud Vision API

Cloud Vision APIは、Google Cloud Platform(GCP)が提供する、機械学習を利用したサービスである。
Cloud Vision APIに画像を送ると、Googleが既に実用化している画像の機械学習モデルを利用して写真の解析を行う。
利用方法は、Cloud Vision APIのREST API直接問い合わせを行う方法とGoogle機械学習のSDKを利用する方法がある。

Cloud Vision APIでできる事

Cloud Vision APIに問い合わせを行うと画像に写っている様々な情報を返してくれる。
APIの機能は大きく以下の7つの機能を持っている。

・ラベル取得(LABEL_DETECTION)
画像に写っているものが、動物、乗り物、果物など何が写っているのか、それを認識して写っているものの名称(ラベル)を返り値にとして渡すもの。

・有害コンテンツの判別(SAFE_SEARCH_DETECTION)
画像に有害なコンテンツが含まれているかの判別を行う。4項目(アダルト、画像改変、臓器、暴力)について、VERY_UNLIKELYからVERY_LIKELYの5段階で評価を行う。

・顔認識(FACE_DETECTION)
写真に顔が写っている場合にその顔の角度や表情(楽しんでいる、驚いている、悲しんでいる、怒っている)などを認識する事が可能。

・ランドマーク検出(LANDMARK_DETECTION)
写真に写っている、自然物や人工物の名称とその位置情報を返す。

・ロゴ検出(LOGO_DETECTION )
画像に含まれる商品やメーカーのロゴを検出する事が可能。

・OCR機能(TEXT_DETECTION)
画像に含まれる文字情報などを認識して、文字を返す。
日本語かつ、斜めからの写真などでも高精度に検出する事が可能。

・画像情報の検出(IMAGE_PROPERTIES)
画像の色情報などの解析を行う。

利用料金

Cloud Vision APIは、ユニット単位の課金となる。例えば、1画像のリクエストに対して、ラベルとログ検出の2種類の画像認識を行うと2ユニットとしてカウントされる。

いずれも1000ユニットまでは無料で利用可能だが、1001から100万ユニットで1.5ドル、100万から500万、500万から2000万という単位で+1.5ドルまたは+0.6ドルt単位で価格が上がる。
ただし、有害コンテンツの判別については、ラベル取得と同時に使用する場合において無料となる。

関連する他の用語