GRANVALLEY

ブログBlog

BIツールに最適なGoogle BigQueryを利用する効果

公開日 2019年5月27日    最終更新日 2020年3月12日

企業が大量のデータを生成するようになった今、自社で必要な洞察を得るために、より効果的かつ迅速にそのデータを活かすことができるツールを選定することが重要です。それは、データを単純に保存して整理するだけでは不十分です。また、たとえ最も効果的なデータ構造であっても、何百万ものデータポイントを迅速に分析することは困難になる場合があります。

Googleが提供するデータウェアハウスであるGoogle BigQueryは、何十億行ものデータを調べて、それぞれの分析に適したデータを見つけるのに最適なツールです。その高性能な設計とカラム型データベースのおかげで、大規模計算クラスタにより集計を行うことができ、適切なBIツールを組み合わせることで、あらゆるビジネスにとって強力なツールになります。

これが、Google BigQueryを検討すべき最大の理由の一つです。

柔軟なアーキテクチャがクエリの速度を上げる

Google BigQueryは、複数のコンピュータクラスタを個別に管理する必要がなく、コンピューティングリソースを動的に分配するので、データのスキャン時間とシステム構築のコストを大幅に削減することが可能です。そのため、複数のコンピュータクラスタを中心に設計された強固な構造にとらわれずに、必要な場所に処理能力を素早く分配させることができます。

Google BigQueryの「サーバーレス」ビルドは、クエリのスケーラビリティと素早さを優先した完全なクラウド上の設計であるため、クラウドベースのサーバー構造よりもはるかに迅速で簡単にアドホック分析の拡張および実行が可能となります。さらに優れた点は、分散型設計により、これらのクエリを実行し、ペタバイト規模まで拡張されたデータセットから洞察を導き出すことができるという点です。

スケールに合わせた価格体系を提供する

Google BigQueryは、中小企業や進化し続けるアナリティクスニーズを持つ業務部門などに応じるため、さまざまな料金体系を提供しています。 Google BigQueryの料金モデルは、サーバー容量への課金やカスタマイズされたプランの価格設定ではなく、処理能力とニーズに基づいています。このプラットフォームにより、フルサーバーのコストを支払うことなく、新しいインスタンスの開始が容易になります。

Google BigQueryの価格体系は、コンピューティングの需要とリソースの割り当てに基づいており、ユーザーが1秒ごとに必要なリソースを設定することができます。さらに興味深いことに、このプラットフォームは100%のリソース使用率を保証しています。つまり、固定モデルに基づいて過剰に支払う必要はなく、使用している処理能力の分のみの支払いで済むのです。このモデルは非常にスケーラブルであるというメリットをもたらすため、中小企業は、スケールダウンのコストを気にすることなく、目の前のタスクに基づいて必要なリソースをデプロイできます。

必要なデータにオンデマンドでアクセスする

アドホック分析を実行してリアルタイムによる分析を行う場合、データウェアハウスからデータを呼び出して、その抽出結果を利用すると、ほんの数秒の違いで古い結果を見ることになります。Google BigQueryは、クラウドネイティブのデータウェアハウスモデルによって、この問題を解決します。これは、負荷を減らすために設計された2つの主要なツール、Google BigQueryのbatch ingests capabilityとreal-time ingest capacityに由来します。

前者は、計算量を減らすことなく何千ものデータポイントを分析ツールに簡単にロードできる機能です。SQLのような分析および管理ツール専用のリソースから取り出すのではなく、自身のコンピューティングリソースを使用するため、リアルタイムのクエリ機能には影響を与えません。後者は、テーブルあたり最大100,000行のデータロードも簡単に実行でき、瞬時にアクセスすることを可能にします。場合によっては、シャーディング(DBアクセスを分散させる方法)を行うことで、最大100万行までロードすることも可能になります。Google BigQueryのこれらの機能により、リアルタイム分析が素早く効率化されます。

データセットを最適化するAIの基盤

Google BigQueryの、ユニークかつ非常に有効な機能の一つが、バックグラウンドでストレージとデータセットを最適化するというものです。このプラットフォームは、データストレージを継続的に評価し続けるために、コンデンサ、ストレージフォーマット、およびAIを最大限活用しています。パターンが検出されると、Google BigQueryはそれらを使用して、ユーザーが定期的に実行している分析やクエリの種類によって適した構造にデータセットを最適化します。

コンデンサは完全に透過的で自動化されているため、これらのプロセスはひとりでに処理されますが、発生状況は常にユーザーに通知されます。その結果、機械学習アルゴリズムのおかげで、プラットフォームは多くのクエリを作成するにつれ高速になります。これは、Google BigQueryのフルマネージドスタックとそのキャッシングツールとの組み合わせの結果でもあり、過去24時間以内に実行したクエリであれば、ユーザーは無料でクエリを実行できます。全体的に見ると、90日ごとにコストが削減され、ストレージの価格は50%近く低下しています。

BIに適したデータウェアハウスを選択する

Google BigQueryを使用すると、データのクエリおよび処理方法が高速に最適化され、コストのかかるサーバーやシステムへの依存度を減らすことができます。ただし、Google BigQueryはとても強力ですが、本当に有用な洞察を導き出しインタラクティブなダッシュボードを作成したい場合は、Google BigQueryをBIプラットフォームなどの付加的なツールに統合することをお勧めします。

 

この投稿に記載されているすべてのデータは情報提供のみを目的としており、正確ではありません。前もってご了承ください。
本記事は、Sisense社の許諾のもと弊社独自で記事化しました。
https://www.sisense.com/blog/the-benefits-of-combining-google-bigquery-and-bi/

Sisense は、Sisense Inc の商標または登録商標です。
※ その他の会社名、製品名は各社の登録商標または商標です。
※ 記事の内容は記事公開時点での情報です。閲覧頂いた時点では異なる可能性がございます。