GRANVALLEY
データであなたの「ミチ」をてらす

GRANVALLEY

ブログBlog

データウェアハウスにRedShiftを使う5つのメリット

BIでデータ分析をする上で、適切なデータウェアハウスを選択することは、データをどのように集めるかという課題と同じくらい、重要な要素です。例えデータの最大値を求めるような簡単な処理であっても、その背景にはデータを計算しやすく保管し、並び替え、簡単にアクセスできるような仕組みが必要不可欠です。Amazon Redshiftはデータウェアハウスに必要なそれらの機能を持っていますが、その上で、システムを統合する前にこの製品がどのようなメリットをもたらすのかを理解することが重要です。

それでは、通常のデータストレージからRedshiftに切り替えるメリットは何でしょうか?そこには、データウェアハウスが大きな容量を持つことに加え、BIを使用する上で非常に大きな利点がいくつかあります。ここでは、BIの使用を前提としたときのRedshiftによるデータウェアハウス構築の5つの利点をご紹介します。

クエリスピードの大幅な改善

ペタバイトに迫るような巨大データセットのクエリは、当然ですが処理に多大な時間が掛かります。しかし、近頃のデータベースやウェアハウスはデータリクエストへの返答と同時に他の作業を平行してこなすように工夫されています。その中でもRedshiftのアーキテクチャは特にクエリの平均・照会スピードに拍車をかけています。

例えば、RedshiftとHadoopの比較では、Redshiftの方が10倍近い速度でクエリを処理することがわかっています。AmazonのMassively Parallel Processing技術によって、Redshiftに接続したBIは、ワークロードを削減しながら同時に複数のクエリ処理を実現することかできるのです。

簡易性とアクセシビリティ

登場から30年以上経った今でも、MySQLはもっとも人気のあるデータベースとして広く使われています。MySQLのもつシンプルなクエリベースシステムが、さまざまなプラットフォームへの適用を容易にしています。そこでAmazonは、多大な時間と労力が必要な新しいシステムを一から構築するのではなく、MySQLのような利便性のあるプラットフォームを構築することにしました。

いくつかの相違点はあるものの、RedshiftはMySQLのように使うことができ、それに加えてBIツールへの接続を容易にするPostgreSQL、JDBC、ODBCドライバー等のバックエンドツールも内包しています。さらに、既に存在している他ツールへの接続や、エンドユーザーでも簡単に理解できるような簡易性を備えていることも特徴です。

柔軟なスケーリング

RedshiftはAWS上のクラウドサービスであるため、需要や仕様用途にあわせてストレージ容量や性能をその場ですぐに拡張することができます。これによって、急速なデータ需要拡大につきものであるスケーリングコストの増大やシステムの複雑化を避けることが可能です。

AWS上のサービスであるため、すぐにノードごとのサイズを増減させることが可能です。同時に、企業はシステム構築にコストを掛ける必要もなければ、メンテナンスする必要もありません。容量が必要ならばサイズを増やし、不要になれば減らせばよいだけです。この利点は特に中小企業のような成長余地が多く残っている組織にとって大きな利点となるでしょう。

低コスト維持が可能

AWSはどのような規模の企業に対しても高いコストパフォーマンスを発揮します。RedshiftもAWS上のサービスであることから費用対効果に期待ができ、パフォーマンスとのバランスを管理しながら柔軟にコストを変えることができます。この価格設定は、Amazon社のクラウドインフラストラクチャーにおけるワークロードの効率化技術によって実現されています。

それに加え、利用企業は需要に合わせて料金プランをオンデマンドかリザーブかを選択することが可能です。前者は規模の小さな企業やデータウェアハウス需要がそこまで大きくない場合に有用で、後者はより安定したエコシステム構築に向いています。この料金体系は、単純な価格設定である以上に、需要に合わせたスケーラビリティが可能であることがわかります。

堅牢なセキュリティ

大量データは多くの場合、個人情報などのデリケートなものが含まれます。仮にそういったものがなかったとしても、企業にとって重要な情報があることがほとんどです。そのため、データウェアハウスではデータの機密性をしっかりと保護する機能が必要です。Redshiftでは、複数の暗号化技術とセキュリティツールの併用によって、データウェアハウスの防御を堅牢かつ容易にしています。

このセキュリティ機能にはVPCによるネットワークの分離や、異なるアクセス管理ツールによる粒度の細かい設定機能も含まれます。さらに、RedshiftはSSL通信によるデータの暗号化機能も搭載しており、AWS S3はクライアントとサーバーの両サイドで暗号化処理を施します。

正しいデータウェアハウスを選ぶ

BIのためのエコシステム構築は、なにはともあれデータから始まります。柔軟性とスケーラビリティのあるデータウェアハウスを選択することで、BIをより価値の高い、分析と洞察を引き出すツールとして役立てることができるでしょう。

 

この投稿に記載されているすべてのデータは情報提供のみを目的としており、正確ではありません。前もってご了承ください。
本記事は、Sisense社の許諾のもと弊社独自で記事化しました。
https://www.sisense.com/blog/5-advantages-using-redshift-data-warehouse/

Sisense は、Sisense Inc の商標または登録商標です。
※ その他の会社名、製品名は各社の登録商標または商標です。
※ 記事の内容は記事公開時点での情報です。閲覧頂いた時点では異なる可能性がございます。