ICTが不可欠となっている現代のビジネスにおいて、ビッグデータの活用が重要視されています。ビッグデータとは単に大量のデータのことと捉えられがちですが、データ量のほかにも、いくつかの要素を満たすことでビッグデータと呼ぶことができます。
ここではビッグデータの定義、活用することのメリット、考慮が必要な部分、実際の活用事例などを紹介します。
ビッグデータとは
ビッグデータは単純に「大量のデータ」と捉えられがちです。確かに、データの量もビッグデータを定義するうえで必要な要素です。しかし、現在使われているビッグデータという言葉は、量的な大きさだけで決められるものではありません。
ビッグデータの目的に着目した定義と、特徴に着目した定義のふたつの観点から見てみましょう。
何かを生み出す可能性を持つデータ群
総務省刊行の平成24年版情報通信白書では、ビッグデータを目的の観点から考えると、「事業に役立つ知見を導出するためのデータ」と定義した例をあげています。ビッグデータは単なる大量のデータの集まりではなく、そこから何か価値を生み出すために蓄積された、大量のデータの集まりであるという見方ができます。
データに価値を与える「4つのV」
ビッグデータの定義として有名なものは、2000年代の初めにIT調査会社のアナリスト、タグ・レイニー氏によって提唱された「3つのV」です。ビッグデータはVolume(量)・Velocity(速度)・Variety(多様性)という3つの要素を備えている必要があるとしたものです。
現在でもビッグデータの定義として、3つのVはよく紹介されています。
IBM社は、この3つのVにVeracity(正確性)を加え、「4つのV」としてビッグデータに必要な要素を提唱しています。
総務省刊行の令和元年版情報通信白書でも、この4つのVを引用し、これからのビジネスにおけるビッグデータの重要性を解説しています。
参考:令和元年版情報通信白書 データはどのようにして価値を創出するのか「図表2-1-2-1 データに価値をもたらす4V」|総務省
このなかでは、データは価値を創出する源泉であり、4つのVはデータに価値をもたらすための要素であると表現しています。4つのVを持ち合わせてこそ、ビッグデータとしてビジネスに活用していける価値が与えられるという考え方です。
4つのVが持つそれぞれの意味
4つのVには、それぞれ次のような意味があります。
- Volume(量)
純粋に情報の量を意味します。例えば、1人の購入履歴では社会全体における人気商品の傾向はつかめませんが、多数の人の購入履歴を分析すれば、どのような商品がどういった条件のときに売れるかという傾向を見つけることが可能です。 - Velocity(速度)
古い情報は役に立たない場合もあります。常に変化するものごとに対して活用する場合であれば、常に最新の情報を分析しなければ精度を上げることができません。例えば、特定の感染症の感染者数を推計する場合には、リアルタイムな速度のあるデータを必要とします。 - Variety(多様性)
偏りのあるデータでは、全体的な傾向とのズレが生じやすくなります。例えば、10代から20代の購入情報だけを集めても、全年齢層における人気の傾向はつかめません。年齢や性別、住んでいる地域や家族構成、参加コミュニティのジャンル、趣味や関心などの多様なデータが入手できれば、より緻密な分析ができます。 - Veracity(正確性)
データのなかには間違った情報や、参考にできない特異な情報も含まれます。特に全体から一部のデータをサンプルとして抽出し、そこから全体の傾向を推計する際は、正確なデータを集めることで精度が上がります。
これらの4つのVを満たすデータは、価値を創出するために活用することが可能となり、ビッグデータとして、現代のデジタル経済に欠かせない重要技術となるのです。
なお、ビックデータは、DX(デジタルトランスフォーメーション)に必要といわれる技術のひとつです。DXに必要なそのほかの技術については、「DXを支える技術とは?技術を生かしてDXを推進するのに必要な人材も紹介」や「DX実現に必要なテクノロジーとは?種類や活用事例を紹介」をご覧ください。
ビッグデータ活用のメリットと考慮点
ビッグデータを活用することでどのようなメリットがあるのか、また考慮しなければならない点について見ていきましょう。
ビッグデータ活用で生まれるメリット
データ群が4つのVを満たす場合、小規模なデータでは見いだせず未活用だったデータ群から、新たな規則性や相関関係が発見されることがあります。こういった新発見は、ビジネスの意思決定材料として使える可能性を持っています。
新たに発見した規則性や相関関係は気づきを生み、新たな手法や工法を生み出し、これまでにないビジネスモデルを創出する可能性を持ちます。
また、データに速度や正確性があることで、リアルタイムな現状把握と需要予測が可能になり、マーケティングの成功率が高まります。それらのマーケティングがどのように実を結んだのかを、高い精度で検証することも可能となり、次のビジネスへとつなげていくことができます。
これらのサイクルによって、市場のニーズを発見し、新たな手法や工法と結びつけて新たなビジネスを創出する可能性もあるのです。
ビッグデータを活用するうえで考慮すべき点
では、ビッグデータを活用する際には、どのようなことに考慮しておかなければならないのでしょうか。
4つのVのひとつとしてVeracity(正確性)があげられるように、データが正確でない場合、それを活用した結果の成功率は低下します。また、不要なデータが多量に含まれていれば、それらを除外して分析する時間がかかり、Velocity(速度)が失われるでしょう。
以上のように、4つのVを維持できなければ、ビッグデータも活用効果が低下します。4つのVを維持しビッグデータの価値を高めるためには、データ集中と分析の基盤整備が必要です。
それと同時に、データの保管と取り扱いにも注意が必要です。セキュリティの重要性を理解し、対策を実施していなければ、大きなリスクを背負うことになります。例えば、単体では個人情報に結びつかなくても、複数のデータを組み合わせることで個人を特定できる可能性があるため、十分な倫理的な対策と対策が必要とされます。
また、人材不足も、ビッグデータ活用における大きな課題のひとつといわれています。ビックデータの分析においても、管理面においても、ICT分野で問題視されている人材不足はビッグデータ活用の障壁となっています。ビッグデータの分析を行うデータサイエンティストや、情報セキュリティを専門とするセキュリティエンジニアなどの育成が急がれます。
ビッグデータが活用されている身近な例
ビッグデータは次のような場面で活用されています。
自動販売機によって消費者行動のデータ収集・分析
大手飲料メーカーでは、自動販売機にアイトラッキング機能を搭載し、そこから得られるデータを商品配置決定に活用しています。
アイトラッキングとは、人の目線がどこに向かっているかを追う技術です。購入者がどのような場所から商品を見るかといったデータを蓄積して分析し、主力商品をどこに配置するかの決定に役立てています。
ビッグデータによって農業の確実性を向上
農業分野でも、ビッグデータをもとに確実性を向上し、収量を安定化させる事業実証に取り組んでいる例があります。
カメラで撮影した画像から植物の活性度をデータ化し、生育状況を把握します。また、ローカルアメダスからの気象データ、GPSデータなどを合わせ、生産者に提供します。こういった情報をもとに、育成条件を調整したり、収穫時期を決定したりすることが可能となります。
製造現場における予防保全の新たなビジネスモデル
製造業ではビッグデータを、普及しはじめた当初から予防保全に活用していました。予防保全とは、故障や部品破損が起きてから対処するのではなく、蓄積したデータをもとに、メンテナンスや部品交換が必要になる時期を予測し、事前に対処する保全手法です。
さらに機器や設備のIoTを進めることで、異音や異常振動、負荷の上昇などを検知し、より綿密な予防保全が可能になります。機器や設備のIoT化を進めて監視を行い、異常発生タイミングの予測や要因の分析などを代行するビジネスモデルも生まれています。
ビッグデータを活用するために正しく理解し正しいプロセスを
ビッグデータについて、ふたつの観点から見た定義と重要性、メリットや考慮するべき点、実際に身近で行われている活用事例などを紹介しました。
ビッグデータは単なる大量のデータ群ではなく、Volume(量)、Velocity(速度)、Variety(多様性)、Veracity(正確性)といった4つのVが求められます。情報の量と質を同時に維持するためには、データの収集・分析・予測において、適切なプロセスを実行しうる基盤を整備することが重要となります。
ビッグデータを正しく有効に活用することで、ビジネスや社会全体におけるさまざまな場面に生かすことができ、新たな価値の創出が期待できます。