ここでいう「クラウド」は広義のクラウドサービスではなく、スケールアウトする分散処理技術としてのクラウドのことです。サービスとしてのクラウドは以前取り上げたようにいくつかの利点がありますが、クラウドでないと実現出来ないキラーアプリケーションというのは実はあまり無いのが現実でした。
しかし昨年秋に開催されたHadoop World 2009から、データウェアハウス、データ分析にクラウド技術を採用すると今まで不可能であった高速大量データ分析が可能になることが注目され始めたようです。VISAやチャイナテレコム、JPモーガンなどがHadoop MapReduceのようなNoSQLデータベースの実用化を始めている事が発表され、国内でもヤフーや楽天での実績が出始めています。
データウェアハウス(ビジネスインテリジェンス)の分野では20年以上前からテラデータ、Oracle、最近ではNeteezaやSun/Oracle Exadataなどの、SQLでの大量データ処理に特化してきた高価なシステムが必要でした。しかし近年のデータ量の爆発的増大に答えたくともユーザーはこれ以上高価な投資はできないので、保存期間を短くしたりサマリーに集約したりしているのが現状でしょう。
Clouderaのブログで紹介された欧州最大のターゲティング広告プラットフォームのnugg.adの事例では、オープンソースのCloudera Hadoop CDH1 ディストリビューションを採用し、Opscodeの Chef を用いたプロビジョニングを行っています。サーバー3台でのスモールスタートから始め、今では計36コア、8TBのディスクのクラスタで処理、以前では5日かかった処理時間を1時間に短縮し、これまで提供が考えられなかったような付加価値サービスが可能となり大きな投資対効果を実現しています。
このようにペタバイトクラスの超大規模データウェアハウスではなくとも、データ分析を競争力としたい先進ユーザーは、新たな選択肢としてクラウド技術を活用したNoSQLデータウェアハウスを検討し始めています。この分野は当分のあいだ目が離せそうにありません。
そろそろ世の中の「クラウド」話も出尽くしてきた感があるので、この辺りで私なりに整理したいと思います。昨年からの「クラウド」の大合唱はIT関連で久々の流行語大賞のような気がしますが、これだけ言われるという事は単なるバズワードではなく、構造変化の底流があるように思います。
まずは、米国 NIST(National Institute of Standards and Technology:国立標準技術研究所)の定義から。“The NIST Definition of Cloud Computing” Authors: Peter Mell and Tim Grance, Version 15, 10-7-09 ( http://csrc.nist.gov/groups/SNS/cloud-computing/ )
『クラウド・コンピューティングとは、(利用者にとって)最小限の管理労力、あるいはサービス提供者とのやりとりで、迅速に利用開始あるいは利用解除できる構成変更可能な計算機要素(例えば、ネットワーク、サーバ、ストレージ、アプリケーション、サービス)からなる共有資源に対して簡便かつ要求に即応できる(オンデマンド)ネットワークアクセスを可能にするモデルである。』
クラウド・コンピューティングが満たすべき5つの条件
|
On-demand self-service オンデマンド・セルフサービス | ユーザー自身が提供者の手をわずらわせずに、必要に応じてコンピューティング資源を利用できる。 |
|
Resource pooling: Location independence リソースのプーリング | コンピューティング資源がプーリングされており、必要に応じて割り当て・解放可能になっている。ユーザーは物理的な場所については意識する必要がない。 |
|
Rapid elasticity 迅速な弾力的拡大・縮小 | ユーザーの必要に応じて瞬時に処理能力を拡大したり縮小できる。 |
|
Measured service 計測されたサービス | リソースの使用量が自動的に計測され、最適化される。また提供者だけでなくユーザーからも監視、コントロール、レポートが可能。 |
これだけでは今ひとつピンとこないしこの条件に当てはまらないものも「クラウド」を名乗っていますので、私なりの「広義のクラウド」を定義したものが、下図のような従来のASPやSaaSまで含めてのサービス基盤です。これだと、世の中の「クラウド」サービスはほとんど当てはまると思います。(自社所有のいわゆるプライベートクラウドは、ここでは論じません)
しかし、従来のASPやSaaSになかった「クラウド」の大きな特徴は、
1.超スケーラビリティ(数十万ユーザー、数千ノード、数PB以上)
2.数分で立ち上げられ、数分でやめられる、リアルタイムオンデマンドサービス
3.完全従量課金、使わなかったら払わなくて良い
の3点です。
1.の超スケーラビリティは一般企業の業務ではあまり関係ないかもしれませんが、2.3.はユーザー企業の購買行動に大きな変化をもたらします。つまりこれまでは企業で何らかのシステムを使い始めるためには、少なくとも数ヶ月と数百万円くらいは必要だったのが、数日で数千円からで可能になり、不要だとわかったらすぐやめられるようになった訳です。
もちろん企業に「クラウド」が普及するためには、セキュリティやガバナンスなどまだまだ足りないピースがありますが、サービスプロバイダにとっては数分で顧客を獲得出来る代わりに数分で失う事にもなり、ソフトウェアベンダーにとっては使わなくても使用料金を払わなければいけなかったのが当たり前だったのが、使わなかったら払わなくて良いのが当たり前の時代がやってきます。
このようにユーザーのスイッチコストが限りなく小さくなっていく方向は、OSS(オープンソースソフトウェア)の普及によってさらに加速すると考えられます。また、Hadoop MapReduceのようなクラウド技術によってこれまで不可能であった大量高速データ処理が可能になったように、「クラウド」でないとできない事はOSSが主体になってきています。
AmazonやGoogleなど本来ITベンダーではない企業が「クラウド」とOSSをリードしていることも、彼らが本業のITインフラコストがどんどんふくれあがる事を抑制するために真剣に考え続けた結論が、他の企業にオープンし共有する戦略だと考えられます。この結果「クラウド」とOSSはこれまでのIT業界の地殻変動を起こし、ユーザーを囲い込むのではなくユーザーにとっての本当の価値を共有できるベンダーが生き残っていくのではないでしょうか?

コメントを投稿する