Go Faster. Grow Bigger.

IoT・ビッグデータの利活用をスムーズに実現するために最適化された次世代のオープンソースデータベースです。
従来のデータベースでは困難だった、高頻度・大量に発生する時系列データの蓄積とリアルタイム処理を可能とします。

なぜGridDBなのか?

IoTデータを効率よく処理-管理するキーコンテナ型データモデルを採用

データモデルには、リレーション型 、キーバリュー型、ワイドカラム型、ドキュメント型などあります。これらのデータモデルには、それなりに利点があります。

  • リレーション型:データは2次元の表形式(テーブル)で格納され、かつデータ間の関連もまた表形式(テーブル)で格納される。データ定義や関係性の整理といったスキーマ定義を厳密に行い、ACID トランザクションをサポートし、参照整合性と強力なデータ一貫性を維持するように設計されています。従来の業務アプリケーションに適しています。
  • キーバリュー型:キーとバリューを単位としてデータを格納する。シンプルで応答が早い
  • カラム指向型:1つの行キーに対して複数の列を持つもの。行ごとに異なる数の列を持つことができるため、柔軟なデータ運用が可能です。列方向の集約が高速であるため集計処理にも適しています。
  • ドキュメント型:バリュー部分が、JSONの半構造化のドキュメント。スキーマレスなので、複雑なデータを柔軟に運用することができ、一般的なウェブシステムとは相性が良いといわれています。
IoTの実世界では、機器1に対して、センサーA、B、機器2に対してはセンサーC、D、Eというような形態が多く、これを容易にかつ有効的にモデル化するために、GridDBでは、独自に拡張したキーコンテナ型のデータモデルを採用しています。

キーコンテナ型のデータモデルでは、キーバリューのバリューをグループ化するコンテナというRDBのテーブルに似た概念を導入し、対象ごとにデータを格納します。コンテナに対してデータ型を定義するスキーマ定義とカラムのインデックス設定により高速に検索できるようにしています。また、コンテナ内のロウ単位でトランザクション操作が可能でコンテナ単位でトランザクションのACID (Atomicity、Consistency、Isolation、Durability)を保証しています。

時系列データを容易に管理

コンテナには、2種類:一般的なさまざまなデータを管理するために順序には関係なくレコードが格納されるコレクションコンテナと時間順にレコードが格納される時系列コンテナがあります。

時系列コンテナには、時系列レコードを圧縮する機能や 一定の期間を過ぎたデータをデータベースに負荷なしに自動的に削除する、期限解放機能、また、時系列分析関数などの時系列データに必要な機能を用意しています。

ペタバイト規模に対応可能な⾼い処理能⼒

GridDBには、「メモリが主、ストレージが従」という思想で、さまざまなアーキテクチャ上の⼯夫が組み込まれ⾼速化を実現しています。たとえば、 GridDBでは、⾮同期的なデータ処理を絶え間なく実⾏するイベント駆動⽅式を開発し、CPUコア・スレッドごとに占有するメモリとデータベースファイルを割り当て、排他、同期処理の待ちをなくしています。

また、GridDB は、⼤量のデータを処理するためにできるだけ同じブロックに ʻ主要ʼ なデータを配置する独⾃の時系列データ配技術 (TDPA:Time Series Data Placement Algorithm) により、アプリケーションがアクセスを必要とするデータを局所化します。アプリケーションのアクセスパターンやアクセス頻度に応じてメモリ集約のヒントを設定することで、メモリ領域を有効活⽤し、メモリのミスヒットを減らします。

オープンコミュニティの英知とを終結しエコシステムのパワーを最大限に活用

開発者、お客様、パートナーとのオープンコミュニティ活動を通じて課題意識、経験や知恵を集結。また、CPS/IoT分野で有力なOSSやベンダーとの連携を促進し、先進的なシステムを迅速に実現が可能です。