デジタルで豊かな社会の実現を目指す東芝デジタルソリューションズグループの
最新のデジタル技術とソリューションをお届けします。

世の中のさまざまなモノへIoT(Internet of Things)の適用が広がる中、サイバーフィジカルシステム(CPS:Cyber Physical Systems)が注目されています。CPSとは、実世界(フィジカル空間)にあるIoTデバイスやセンサーから多種多様な情報を収集し、仮想世界(サイバー空間)で大規模データ処理技術などを駆使してリアルタイムに分析し、そこで創出した情報や価値を実世界に戻すことで、産業の活性化や社会問題の解決を目指す仕組みです。ここでは、CPSを実現するために必要となるデータ基盤技術と、そのコアとなる「データベース管理システム(DBMS:DataBase Management System)」について、3回にわたって解説します。

第1回では、従来とは異なる「NoSQL」と、ビッグデータやIoTシステムに特化した東芝のデータベースである「GridDB」が誕生した背景、そしてGridDBの基本的な特長の中から独自のデータモデルであるキーコンテナ型データモデルについて紹介しました。第2回では、進化を続けるGridDBにおけるデータ基盤技術の特長と、ペタバイト級の製造データの活用に貢献した実際の適用事例を解説しました。連載最終回の第3回では、データベースのクラウドサービスであるDBaaS(Database as a Service)が求められる背景、GridDBのDBaaSであるGridDB Cloud、そしてGridDBのオープンソースソフトウェア(OSS:Open Source Software)活動について解説します。


DBaaSが求められる背景とは


従来は、ユーザーが管理する施設内に機器を設置し、サーバーやデータベース管理システム(DBMS)を運用するオンプレミスによる利用形態が一般的でした。この利用形態では、ユーザーは機器を含めたさまざまな要素を自社で管理する必要があります。その後、技術革新によって仮想化技術や高速インターネットなどが進展したことにより、2000年代後半にクラウドコンピューティングサービスが普及します。これは、サービスを提供するプロバイダーがIT機器やソフトウェアを管理し、ユーザーは遠隔からインターネットを経由してアクセスすることで、サーバーやアプリケーションなどを利用する仕組みです。

クラウドコンピューティングサービスの拡大を受け、DBMSも、DBaaS(Database as a Service)と呼ばれるクラウドサービスでの利用が求められ始めます。実際にDBMSの市場規模を見ると、ここ数年の間に目覚ましく成長したDBaaSは、オンプレミス型のDBMSを上回る見込みです

※DBMSの市場規模、DBaaSがオンプレミスに並ぶ
シェア1位はMicrosoft。Amazon(AWS)はオラクルを抜いて2位に。ガートナー調査, https://www.itmedia.co.jp/news/articles/2204/18/news063.html

 

オンプレミス型のDBMSとDBaaSの違いを整理します(図1)。

DBaaSは、オンプレミス型のDBMSと比較し、さまざまな観点でその有用性を示しています。しかし、DBaaSがすべてのケースに対応できるわけではありません。例えば、法令に基づいたりセキュリティを担保したりするために、社内にサーバーを置かなければならないケースもあるでしょう。DBaaSは、多くのケースにおいて有力な選択肢ですが、構築するシステムの目的や要件を分析した上で、適切なDBMSを選択することが重要です。


スムーズなデータ運用・管理を実現する「GridDB Cloud」


DBaaSへの高まる期待に応えるため、東芝は、自社製のデータベース管理システム「GridDB」をMicrosoftが提供するクラウドサービスのAzure上で動作させ、さらに運用管理を容易とするマネージドサービスで提供する「GridDB Cloud」を開発しました。

GridDB Cloudには、GridDBが持つ技術的な強みに加え、次のような特長があります。

  • 構築設計が不要で、導入期間を短縮
  • データを可視化する機能の充実
  • 運用の効率化
  • OSSやAzure上のサービスとの連携の容易性
  • データ量や処理量の増加に応じたリソース増強の容易性

 

これらのうち、いくつかの特長について説明します。

GridDB Cloudでは、データの可視化の点において、これまでのGridDBにはないGUI(Graphical User Interface)の機能を充実させました。アプリケーション開発者やデータベース運用者が、データの収集状況の把握や特定のデータの検索を容易にできるようにし、アプリケーションのデバッグや欠損したデータの検出などに役立てられるようにしています。例えば、複数のセンサーから取得して日単位で集計した1年分の値をグラフ化し、GridDB Cloudの運用画面で簡単に表示することなどができます(図2)。

また、GridDB CloudはAzure上で提供していることから、Azure FunctionsやAzure IoT HubといったAzureのサービスや、MicrosoftのPower BI Serviceと連携することができます。そのほかにも、ログデータを収集するFluentdや収集したデータを分析して見える化するGrafanaといったOSSの各種ツールとの連携も可能です(図3)。

GridDB Cloudは、目的や用途に合わせて複数のラインアップを用意しています。CPUやメモリ、ストレージ(SSD:Solid State Drive)の条件により、Standard、Professional、Enterpriseという3つのメニューがあり、さらに3つのノードでの構成とシングルノードでの構成を準備しています。お客さまそれぞれのユースケースに合わせて選択することが可能です(図4)。

導入した後に利用する状況が変化した場合も、柔軟に対応できます。例えば、データベースへアクセスする頻度や蓄積するデータ量の増加によってリソースの増強が必要となったときには、ノードやストレージを追加するオプションにより、即座に対応します。

このようにGridDB Cloudは、コストの削減・スケーラビリティー・可用性・セキュリティといったDBaaSの利点に加えて、高信頼・高性能・高拡張性などのIoTデータベースの特長を兼ね備えたクラウドサービスです。


GridDBのOSS活動


OSSへの関心は年々高まっています。GitHubという、自分のプログラムコードやデザインデータなどを保存したり公開したりできるウェブサービスを例にとります。GitHubが2023年11月に公開した年次レポート「The state of the Octoverse 2023」によると、グローバルでは、2023年に1億人以上の開発者がGitHub 上で開発をしています(前年比26%増加)。そのうち、日本では280万人以上のデベロッパーがGitHubを使用しており、前年比で31%が増加しています。プログラム開発への新しい才能の流入は企業の抱える課題と一致し、GitHub上で支援を受けているOSSの開発プロジェクトの数や投資額は、近年増加の傾向にあります。また最近では、Fortune 100に取り上げられた企業のうち30%にのぼる企業が、OSSの管理や戦略立案を担うために OSPO(Open Source Program Office)を設置しています。OSPOが機能することで、オープンソースの戦略を効果的に打ち出す企業が増えていくことでしょう。

※Fortune 100:米国のFortune誌によって毎年発表されるFortune 500の中で上位100社を示すリストであり、米国の企業を売上高に基づいてランキングしたもの。


DBMSにおいても、同様の変革が起きています。DBMSに関する人気を集計してランキングするDB-Enginesによると、2021年以降は、OSSのDBMSが商用のDBMSを上回る人気を獲得しています。これは、OSSであれば実際のシステム構築の前に試すことができ、最適なプログラムやサービスを選択しやすいからです。

東芝が2013年から提供しているGridDBは、高性能なNoSQLデータベースであることがベンチマークテスト※1により確認できているものです。センサーデータの蓄積における根幹として、多くのビッグデータ基盤やIoTシステムで活用されています。これまでの実績を生かし、当社は、ビッグデータ技術を普及させる目標を掲げ、2016年にGridDBのOSS化に踏み切りました。現在、そのソースコードはAGPL-3.0オープンソースライセンスのもと、GitHubでの利用が可能です※2

※1:ベンチマークテストの結果は、こちら(3.66MB)のp17で紹介しています。
※2:GitHubにおけるGridDBのソースコードの利用は、こちらからできます。


2023年12月時点において、GridDBは、GitHubで2200以上のスター(リポジトリーに対する「いいね」)と5000に近いフォーク(リポジトリーの複製を作成すること)を獲得するなど、力強く活気にあふれるコミュニティーを形成しています。リポジトリーにはデータベースサーバーのソースコードに加えて31の追加モジュールが含まれ、この追加モジュールによって、GridDBをKafkaやFluentdなどのさまざまなオープンソースに接続するコネクタや、PythonやNode.js、Rustといった複数のプログラミング言語のドライバーを提供します。この多岐にわたるアプローチにより、データベース技術と多様なソフトウェアが交わる場として、GridDBを中心にシームレスなエコシステムを形成します。

GridDBをより広くユーザーに活用していただくため、すでにご紹介した GridDB Cloud のほかに、「GridDB Community Edition(GridDB CE)」と「GridDB Enterprise Edition(GridDB EE)」を用意しています(GridDB CEとGridDB EEの比較はこちら)。GridDB CEは、複数のオペレーティングシステムに対応し、さまざまな言語で開発できます。ダウンロードしてインストールするだけで、誰でもすぐに使い始めることができるものです。高い性能と柔軟性を高く評価され、世界中のユーザーからすでに数十万回ものダウンロードがされています。一方のGridDB EEは、データセンターに障害や災害が起きてもデータベースの継続した使用を可能にするデータ分散機能や、時系列データに関する集計・欠損データの補間・ナノ秒単位の処理などの機能を提供するものです。品質の保証と管理をしている製品とサポートで、ミッションクリティカルなシステムをはじめ、ビジネスを支えるデータベースとして安心してご利用いただけます。

GridDBのインストールは、LinuxのYUM(Yellowdog Updater Modified)やAPT(Advanced Package Tool)などのパッケージマネージャーによって容易となり、またDockerにおけるGridDBのDockerイメージはDocker Hubで手軽に入手できます。さらに、GridDBのクライアントアプリケーションに対しては、GridDB JDBC(Java DataBase Connectivity)ドライバーのためのMaven Central Repositoryや、GridDB PythonライブラリーのためのPyPI(Python Package Index)など、さまざまな公共リポジトリーを通じて事前にコンパイルされたバイナリが提供されています。

※Docker:アプリケーションをコンテナとして簡単に構築、テスト、デプロイできるソフトウェアプラットフォーム。Dockerイメージは、コンテナの動作環境となるテンプレートファイル。


私たちは、アプリケーション開発者コミュニティーがGridDBの活用を促進する中核となると信じています。GridDBに関する幅広い知識を開発者に提供するため、サードパーティーの企業と協力して、GridDB Developers(日本語版英語版)という開発者向けのサイトを設立し、運用しています。このサイトでは、技術に関するブログを毎週更新し、さまざまな観点からGridDBへの知識を深める情報や考察を提供しています。このブログに加えて、異なる時系列データベースのパフォーマンスの比較、多様なNoSQLデータベースのアーキテクチャー分析、そしてGridDBを使用したソリューションの構築に関する実践的なガイドを含む技術論文などを数多く公開しています。

さらに、私たちは、2023年に行われたStack Overflow Developer Surveyにおいて、回答者の75%以上が、技術ドキュメンテーションやブログ、ハウツー動画などのオンラインリソースからコーディングスキルを身につけているという結果に着目しました。GridDBのユーザーに向けたコンテンツとして、技術ドキュメンテーションは日本語英語で提供し、ビデオ学習を好むユーザーに向けてはGridDBのYouTubeチャンネルを開設し、実践的な内容のビデオや過去のオンラインセミナーのアーカイブ映像の掲載も行っています。また、当社のオンデマンドオンラインビデオコースは、すでに世界85ヵ国から1000人以上のユーザーに利用されています。さまざまな、そして多くのユーザーにGridDBを有効に活用していただけるように、私たちはサポートを続けていきます。

連載全3回を通して、NoSQLやGridDBが出現した背景、そしてGridDBにおける技術的な特長や適用事例、クラウドサービス化、さらにはOSSの活動について、説明しました。今後も私たちは、オープンイノベーションにより、ビジネスや社会でのデータ活用を支える基盤として、GridDBの進化をさらに加速させ、社会へ貢献していきたいと考えています。これからのGridDBに、どうぞご期待ください。

 

※GridDBのコミュニティーからの積極的なフィードバックを歓迎します。GridDBのGitHubページから、お気軽にお寄せください。一般的なお問い合わせは、製品ページのフォームからお願いします。

千葉 一輝(CHIBA Kazuki)

東芝デジタルソリューションズ株式会社
ソフトウェアシステム技術開発センター ソフトウェア開発部 第二担当
スペシャリスト


東芝に入社後、IoT基盤の研究開発に従事。現在は、自社製データベースGridDBのクラウドサービス開発に取り組んでいる。

藤田 慎一(FUJITA Shinichi)

東芝デジタルソリューションズ株式会社
ソフトウェアシステム技術開発センター ソフトウェア開発部 第二担当
エキスパート


東芝に入社後、Knowledge Meisterなどのナレッジ系ソフトウェアの開発に従事した後、IoT基盤の研究開発に従事。現在は、GridDBのクラウドサービス開発に取り組んでいる。

スヘルマン アンガ(SUHERMAN Angga)

東芝デジタルソリューションズ株式会社
ICTソリューション事業部 データ事業推進部 新規事業開発担当
スペシャリスト


東芝に入社後、IoTデータ基盤のGridDBの商品企画の業務に取り組んでいる。

  • この記事に掲載の、社名、部署名、役職名などは、2024年1月現在のものです。
  • この記事に記載されている社名および商品名、機能などの名称は、それぞれ各社が商標または登録商標として使用している場合があります。

>> 関連情報

関連記事