位置情報の活用の重要性は、多くの業界で高まっています。店舗の来客分析、観光地の回遊促進、渋滞対策、タクシー配車の最適化、保険料算定のための運転監視、ショッピングセンター内の動線分析など、位置データは人とモノの動きを可視化し、意思決定を支える有用な情報源です。
一方で、こうした位置データは大規模になりがちです。試算の一例として、1人あたり1日1,000件の位置情報を収集する場合、100万人で1か月に約300億件(約3TB)、3,000万人規模では年間約11兆件(約1PB)に達します。これほどのデータをリアルタイムに処理・分析するには、従来型のデータベース前提の構成では遅延やコストが課題となる場合があります。
従来の位置データ分析では、事前に位置データを統計処理した結果をDWH(データウェアハウス)に格納して活用する手法が一般的でした。数十台のサーバで統計処理を行い、翌日以降に分析結果を得る流れです。この方法はリアルタイム性や柔軟な分析に制約が生じやすいという課題があります。
例えば、地域を125m四方のメッシュに分割し、1分ごとにユニークユーザ数をカウントする場合、東京都(2,194km2)では1日あたり約2億回の計算が必要になります。現実的な処理時間やコストでの対応が難しくなることがあり、その結果、分析範囲の縮小・メッシュサイズの拡大・時間間隔の延長などの調整を迫られ、解像度や有用性の低下につながる懸念があります。
また、OD(Origin-Destination)分析では、任意の2地点間の移動人数をカウントする際に組み合わせが膨大になり、事前に設定した地点間での分析に限定されやすいという課題があります。さらに、統計処理済みのデータでは、個々の移動軌跡や細かな属性(例:年齢層・時間帯など)を組み合わせて柔軟に分析することが難しいという課題も指摘されています(個人が特定されない匿名化やプライバシー配慮を前提とします)。
これらの課題に対して、当社は「GridDB」を活用したアプローチをご提案しています。「GridDB」は、ビッグデータ/IoTシステム 向けに設計されたスケールアウト型データベースで、時系列データの取り扱いとリアルタイム処理を重視した設計が特長です。
今回我々がとったアプローチでは、事前の統計処理を行わず、生の位置データをそのまま DBに格納し、必要なタイミングでオンデマンドに分析しています。これにより、リアルタイム性と分析の柔軟性を両立でき、従来の統計処理型アプローチでは扱いづらかった要件にも対応しやすくなります。
また、今回のアプローチではデータ圧縮にも工夫を施しています。例えば、同一直線上の中間点や移動のない座標の間引き、差分圧縮を適用することで、データサイズの削減が期待できます。実例として、CSV形式で約1,100GBのデータがインデックス込みで約440GBまで縮小できたケースもあります。これは、検索の高速化やストレージコストの抑制に寄与します。
性能面では、90万人・1か月分・約172億件の位置データを対象に、特定の条件下において約1秒で処理できた検証例があります。例えば、ある市の中心から半径1km以内にいたユニークユーザ数を1時間単位でカウントする場合、約0.5秒で結果が得られたケースを確認しています(いずれも構成や条件に依存します)。こうした結果は、従来の統計処理型アプローチでは難しかったリアルタイム分析の可能性を示しています。
1.任意の円形地域に滞在したユニークユーザ数のカウント
2.複雑形状の地域に滞在したユニークユーザ数のカウント
3.任意の2地点間(OD)を移動したユニークユーザ数のカウント
加えて、今回のアプローチでは日時範囲と空間範囲を効率的に絞り込みました。地域メッシュ単位で軌跡データを検索し、境界内部を高速に処理、境界上のデータを詳細検索・抽出することで、精度と応答性のバランスを取りやすい設計を支援します。これにより、施設への来訪者数や滞在時間、属性別の傾向の把握など、リアルタイムを意識した分析の実装につなげやすくなります。
お伝えしたいポイントは、「事前の統計処理をしなくても、生の位置データをDBに蓄積し、必要なタイミングで分析するアプローチが選択肢になり得る」ということです。「GridDB」を活用することで、リアルタイム性・柔軟性・コスト効率の観点から、位置データ分析基盤の検討を進めやすくなります。
本件のプレゼン資料(DB TECH SHOWCASE 2025)のダウンロードはこちらから
本件に関する詳細につきましては、以下からお問い合わせください。

