ビッグデータとは何か

最近ではすっかり日常的に使われるようになったビッグデータという言葉。データを大量に蓄積しておいて、データマイニングによって規則性などを発見してビジネスに生かす、という手法は昔から行われており、DWH(データウェアハウス)という用語で表されていました。データの倉庫ということですね。あらかじめ目的をもって集めたデータとは異なり、とにかくいろいろなデータを集めて集まったものを分析して何か有益な情報を導く、ということですね。

これとビッグデータの活用とはどうちがうのでしょうか。実は内容はあんまり違わない部分も多いです。最も大きな違いとして、ビッグデータと言った場合には、とにかくデータの量が多いということです。最近の処理する側のコンピュータのハードウェア的な能力の向上(ストレージやメモリの大容量化)及びデータを収集する機器の技術向上によってビッグデータが集めやすくなおかつ処理がしやすくなったことから、ビッグデータという新しい名前を付けてみた、という感じですかね。

 

データを収集する機器というのは、各種のセンサがあげられます。例えば、日照時間、降水量、平均気温からある農作物の収穫時期を予測しようとしたとき、現在であれば、畑にセンサをつけてピンポイントでこれらを測定してデータを集めることができます。通信機器が発達し、ストレージの容量も大きくなっているため、測定する時間間隔を短くして大量のデータを集めても平気です。これらはデータ量が多ければおおいほど正確に予測が出来ると考えられるため、有効なビッグデータの利用方法と言えます。

http://www.calbee.co.jp/potatochips/doumei/seiiku.html

 

このほか、話題のものでいえば、交通系ICカードによって集められる人の動きのデータや、多店舗で使える共通ポイントカードによって集められる消費行動のデータなど、ビッグデータの代表的な活用方法となっています。

 

さて、ビッグデータが集めやすく処理もしやすくなったといっても、やはり中小企業にはかなりの負担といなる費用が掛かります。一方、統計学的な手法を使えば、十分なサンプル量さえあればビッグデータでなくてもデータマインニングは可能です。すべてのデータを分析して得られた結果と、サンプルから分析した結果に数パーセントの誤差があるとして、その数パーセントが巨額の利益につながるような業種でなければ、ビッグデータにこだわらなくても良いと思いますが・・・

 

コラム一覧へ