- 代表値で基礎固めせよ
- 標準偏差で散布を知れ
- 仮説と全体像を追及せよ
データ集約はどう行う?
今週は、データの見方を学びました。まず、データを数値に集約する方法として、代表値と散らばりの考え方を理解しました。代表値には平均、荷重平均、幾何平均、中央値などがあり、よく使われる平均値は外れ値に弱いことから、場合によっては中央値が用いられることもあると知りました。また、状況に応じて数値に重みを加える荷重平均や、売上の変化率などに使われる幾何平均がある点も印象的でした。
標準偏差の意味は?
次に、データの散らばりを示す標準偏差について学びました。標準偏差は、平均値からのばらつきを表し、その値が大きいとデータが広く散らばり、小さいと平均値近くに集まっていることを意味します。
分析方法をどう考える?
さらに、集約されたデータを分析する際のアプローチについても考えました。一つは、特徴的な箇所に着目する方法、もう一つはデータ間の比較を通じて差異を見る方法です。いずれの方法でも、グラフを見る前に仮説を立て、そのギャップについて深掘りすることが、良い分析につながると感じました。
全体把握の重要性は?
最後に、仕事上でデータを扱う際、自分の仮説の確認だけに偏らず、まずは代表値やばらつきなどの基本的な数値を俯瞰し、対象のデータ群全体を把握することの大切さを再認識しました。その上で、加工されたデータを見ることで、より客観的かつストーリーとしてデータを理解できると考えています。
勉強することを長らく忘れていましたが、
若い受講生の姿を拝見し、
一生勉強だなと感じさせられました