代表値の意味は何?
データを理解するためには、代表値と散らばりに注目することが大切だと学びました。代表値については、これまで単純平均や中央値が中心だと思っていましたが、加重平均(重みづけを行う)や幾何平均(売上成長率の計算などに用いる)もあることを知りました。
散らばりの特徴は?
また、データの散らばりを把握するためには標準偏差が有効です。標準偏差の値が大きいほどデータのばらつきが大きいことが示され、散らばりをグラフにすると中央が高い釣り鐘型になるのが一般的です。大部分の値は標準偏差の2倍以内に収まるとされ、これを2SDルールと呼びます。この考え方は、日本人男性の平均身長とそのばらつきを求める具体例で非常に分かりやすかったです。
業務で活かすポイントは?
業務面では、意識調査で入社年次のデータが取得できた際に、標準偏差を使ってデータのばらつきを確認してみたいと考えています。社内教育の理解度確認にも、標準偏差が有用であると思いました。
他部署での応用は?
さらに、別部署で実施している顧客アンケートの分析においても、今回学んだ知識が応用できそうです。たとえば、寄せられた意見をカテゴライズして、売上に応じた加重平均を算出することで優先すべき意見を抽出できると感じました。また、幾何平均を用いることで、翌年度の予測も立てられるのではないかと考えています。
今後の展開はどう?
今後、6月末に予定している社内教育のアンケート分析では、理解度の散らばりを明らかにするために標準偏差を調べるつもりです。そして、業務分担の変更が見込まれる中で、顧客アンケートの分析にも加重平均や幾何平均を活用し、前年度データとの比較検証を行う予定です。