点群データ活用に貢献するクラスタリングとセグメンテーションの違いとは
技術革新が進んだことで、広く運用が進みつつあるのが点群データです。無数の点で構成された立体的な点群データは、収集方法の高度化だけでなく、運用方法の多様化が実現したことで、その活躍を目にする機会も増えつつあります。
この記事では、そんな点群データ活用を後押しするクラスタリングやセグメンテーションと呼ばれるデータ活用方法について、点群データの特徴に触れながら詳しく解説します。
目次:
- クラスタリングについて
- セグメンテーションとクラスタリングの違い
- 点群データとは
- 点群データをクラスタリングする意味
- 点群データをセグメンテーションすることの効果
クラスタリングについて
クラスタリングは、簡単に言えばデータが持つそれぞれの類似性に基づいてデータを複数のグループに仕分ける処理のことを指します。
クラスタリングは統計学の世界で頻繁に用いられるデータの仕訳方法の一種で、マーケティングの領域ではよく耳にする言葉です。最近では機械学習の領域でもクラスタリングは行われる機会が多く、AIがデータごとの差異を理解する際にクラスタリングが実行されています。
このように、クラスタリングはデータを正しく処理するための手法として広く用いられていることがわかるでしょう。
セグメンテーションとクラスタリングの違い
クラスタリングと似たような言葉として、セグメンテーションと呼ばれる処理も存在します。セグメンテーションも、クラスタリングと同様にデータを属性情報に応じてグループに分け、データへの理解を踏まえるための方法です。
データを関連性に基づきグループに分けるという点はクラスタリングもセグメンテーションも同じですが、大きな違いとなるのが分類するグループがはじめから存在するのか、全体の属性の傾向から自然とグループが生まれるのか、という点です。
まずセグメンテーションの場合ですが、こちらはデータの属性を把握し、その上でデータを分類するためのフレームワークを用意しておきます。
仕分けのために複数の箱を用意して、そこにデータの属性にあわせ、関連度が高いもの同士でグループ化しカテゴリごとに箱に入れていく作業が、セグメンテーションです。
一方のクラスタリングは、セグメンテーションとは異なり分類のための箱を設けるようなことはしません。データを分析にかけ、自然とグループが生まれていくようなデータの処理を、クラスタリングと呼びます。
どちらも大きなグループについては似たようなものになる一方、クラスタリングを実行した場合、ユーザーが意図していなかった属性に基づく小集団が生まれる可能性がある点は、注目しておくべきでしょう。
点群データとは
クラスタリングやセグメンテーションは多様なデータ活用に使える技術ですが、近年活用機会が増えている領域の一つに点群データが挙げられます。
点群データは、3Dの立体データを直線ではなく、無数の点によって表現しているデータのことを指します。
通常の立体データであれば写実性や描画のしやすさを考慮して直線群によって構成されますが、点群データは現実世界の立体データを正確に取り込むべく、ドット形式で立体を構成します。
遠くから見ると写真のようなデータも、近くで見れば無数の点によって構成されていることがわかるなど、近年の点群データは高度な描画が可能になりました。
点群データは、主に3Dレーザースキャナーと呼ばれる機械を使って取得します。何十年も前に建てられた建物や、山や谷などの自然の構造物は3Dモデルが存在しないため、直接スキャンを行うことで、正確な3Dデータ化を行います。
レーザーを照射した物体から返ってくる光の反射速度を測定し、極めて正確な立体物の3D点群データ化が可能です。
ただ、正確な点群データを取得するためには角度を変えて何度もレーザースキャナーを照射して構造を把握する必要があり、必ずしも簡単に点群データ化がいつでも誰でも行えるわけではない点は覚えておきましょう。
点群データをクラスタリングする意味
点群データをクラスタリングにかけることで、どのようなメリットが期待できるのでしょうか。ここでは主なクラスタリングの効果について、解説します。
正確に物体データを抽出できる
点群データをクラスタリングすることで、まず期待できるのが物体データの正確な抽出です。点群データをスキャンして生成すると、スキャンの過程ではさまざまな異物が含まれ、その情報も点群データに含まれてしまうことが珍しくありません。
特にスキャンしたい物体データが全体の一部分である場合、手動で不要なデータを取り除く工程が発生しますが、これは非常に手間のかかる作業です。
そこで活躍するのが、クラスタリング処理です。点群データをクラスタリングにかけることで、点群データの情報をグルーピングし、大まかなグループを形成して、簡単に必要なデータを抽出しやすくなります。
例えばある会議室の点群データを取得し、そこにあるチェアの情報だけが欲しいとします。通常であれば部屋全体をスキャンして、生成された点群データから壁やドア、テーブルなどの情報を手動で排除する必要が出てくるでしょう。
しかし点群データをクラスタリングにかければ、自動で点群データ上の情報が整理され、不要なグループを削除するだけで作業は完了するので、その必要はほぼなくなります。
物体データからノイズを排除できる
物体データ内に存在する、細かなノイズを排除する上でもクラスタリングは役に立ちます。物体のデータを抽出できた場合でも、ディテールを見ていくと不自然なノイズが残ってしまうケースはよくあることです。
そこで物体の点群データに対してクラスタリングを実行することで、本体とは関係のないデータを洗い出し、ノイズ情報を排除することができます。データ内の点群を整理し、極めて可視性と利便性に優れた点群データとしての加工が実現するでしょう。
点群データをセグメンテーションすることの効果
点群データをセグメンテーションにかけることにも一定の効果が期待できます。セグメンテーションにかけるアプローチの一つとして、セマンティックセグメンテーションにより点群データを画像データに変換する際の速度改善を実現するというものが挙げられます*1。
セマンティックセグメンテーションとは、画像データのピクセル一つ一つにラベリングを行い、機械学習効率を高める手法です。
点群データの画像変換はそれぞれの点がどのような意味を持つのかを解釈しながらデータ変換を行う必要があるため、負荷の大きい作業でした。それをセマンティックセグメンテーションによってコンピュータへの理解を効果的に促すことで、画像変換を高速化するというアプローチです。
まとめ
この記事では、点群データ処理に活躍するクラスタリングやセグメンテーションについて解説しました。それぞれのデータ処理のアプローチは、点群データ活用効率を高めるものとして高い効果が期待できます。
点群データが持つ意味やそれぞれの処理の仕組みを理解し、高度な技術活用を推進しましょう。
建築・土木業向け BIM/CIMの導入方法から活用までがトータルで理解できる ホワイトペーパー配布中!
❶BIM/CIMの概要と重要性
❷BIM/CIM導入までの流れ
❸BIM/CIM導入でよくある失敗と課題
❹BIM活用を進めるためのポイント
についてまとめたホワイトペーパーを配布中
参考:
*1 中部大学「Self-Attention を用いた点群データからのセマンティックセグメンテーションに関する研究」
http://mprg.jp/data/FLABResearchArchive/Master/M21/Abstract/suzukit.pdf