データ分析における比較の重要性とは?
データを比較することは、他のデータと比較することでその意味合いを読み取ることにあります。繰り返しになりますが、「分析は比較なり」が重要です。単純な平均では見落としやすい情報を把握するために、データのビジュアル化を駆使し、バラつきを視覚的に理解することが求められます。比較を行い、グラフを解釈することで仮説を立て、その結果として次に分析すべきデータや分析の深掘りの方向性が明確になります。
代表値だけで十分か?アプローチを考える
大量のデータを比較するアプローチについて考える際、代表値の使用だけではデータの分布状況がわかりません。データの分布を考慮するために、標準偏差を併用します。標準偏差が大きければバラつきが大きく、小さければデータが集約していることを意味します。また、データをビジュアル化することも重要です。実際の業務では、加重平均とデータのビジュアル化が主に行われています。
代表的な数値には以下のものがあります:
**代表値**
1. 単純平均
2. 加重平均
3. 幾加平均
4. 中央値
**散らばりを表す数値**
- 標準偏差:標準偏差が大きいとデータがばらつき、小さいとデータが集約している。正規分布と2SDルールも考慮します。「起こりにくいことが起こっている」という実感値は5%です。
分析の深化にはどのプロセスが必要?
分析の内容に応じた代表値を使い、内容に応じたビジュアル化の方法を考えることが大切です。案件の特徴を「プロセス×視点×アプローチ」で分析することに重きを置くと良いでしょう。会社の施策展開にあたっても、目的に応じた比較を行い、ビジュアル化し、そこから仮説を立てて分析を深めていくサイクルを徹底していきます。過去の導入事例から仮説検証を行い、どの層にヒットしているかをビジュアル化し、現在進めているターゲティングの選定を進めていくことが求められます。
学びの共有はどのように行う?
まず、メンバーにWEEK3の学びを共有し、現在取り組んでいる施策のターゲティングに役立てたいと考えています。根拠のあるデータを作成し、より良い意思決定に繋げることが目標です。代表値と標準偏差の仕組みを理解し、必要に応じて使い分けるために、日常の業務に取り入れてみることから始めましょう。