データ分析とは?というところからエンジニアまでの繋がり
データ分析とエンジニア
データ分析とは、企業や個人がとある事象や目的に対して答えや方向性を求めるときに、様々な情報を集めて導き出す行為。と言えると思います。
例)コンシューマ向けWebサービスを公開している場合でもっと利用者を獲得したい場合 以下のような情報を集めて、Webサービスのこれから育てていく戦略を立てることでしょう。
- 利用ユーザー
- どこの地域の人が多いか(物理地域)
- 利用している端末はなにか(iPhone・Android・PCのWebブラウザ)
- 年代
- 性別
- 時間軸
- どの時間帯のアクセスが多いか(午前・午後・深夜・0時)
- 月のどのタイミングでのアクセスが多いか(月初・中旬・月末・第3土曜)
- コンテンツ
- よく利用されているコンテンツ
- あまり利用されていないコンテンツ
このような情報を集めて分析した結果、いろいろな答えが得られ、 それによって取るべきアクションも変わってくることでしょう。
【分析結果】
- 渋谷の20代女性の土曜の日中帯にコンテンツAがものすごく利用される
【アクション】
- Webサービスの画面配色を20代の渋谷系女性に人気のものに変更しよう
- 新しい機能は金曜の夜から土曜の朝までにリリースを行ってユーザーにお知らせしよう
このように様々な情報から自分の欲しい答えを導き出すことを「データ分析」というと考えています。 データ分析を行う人達のことを「データサイエンティスト」と呼んだりします。 場合によっては、「コンサルタント」も似たようなことを行うこともあるでしょう。
データ分析には、できるだけ多くの情報が合った方が判断要素がたくさんあったほうが良く、 また、その情報が時間軸でどのように変化しているかもわかったほうが良いです。 現在のIT技術の進化により様々な情報は、リアルタイムに様々なところに日々蓄えられています。 これらのデータはとんでもない規模の膨大なデータとなり「ビッグデータ」と呼ばれたりします、 従って、膨大なデータを効率よく取得、分析することが重要になってきています。
ビッグデータは蓄えられているだけでは意味がなく、それぞれのデータに関連性をもたせることが重要になります。 先程の例の「渋谷の20代女性の土曜の日中帯にコンテンツAがものすごく利用される」とは、 いつ、どこで、どのような誰が、みたいな情報が結びついていないと導き出せないということです。
そのため我々エンジニアは、ビッグデータをタイムリーにわかりやすい形でデータ分析を行う人の元に届けるための システムを構築するようなところに関わったりするわけです。 IT技術が進化すればするほど、形・規模・方法を用いたデータ連携も進化し追従していかなければなりません。 身近ですとスマートスピーカーのようなIoTと呼ばれるジャンルもこれから本格的に生活の一部に当たり前に使われるようになるのでしょう。 そういった未来が来るとビッグデータは更に成長を続け、結果として我々エンジニアも更に膨大なデータと戦うことになると思ってます。