代表値と分布はどんな意味?
データ分析では、まず代表値と分布の理解が重要です。代表値には単純平均、加重平均、幾何平均、そして中央値の4種類があり、それぞれの特徴を把握する必要があります。一方、分布は標準偏差を用いて表現され、対象に応じた適切な代表値を選ぶことが求められます。
中央値はどう計算する?
そのため、中央値や標準偏差といった指標は数式に基づいて算出されますが、原理原則を理解すればエクセルの数式機能を活用して求めることが可能です。
平均と中央値の違いは何?
この考え方を踏まえて、昨年度に最も支払い額が大きかった顧客のデータを例に、代表値と分布を算出してみます。特別な事情で多額の支払いが発生しているため、単純平均と中央値の数字の違いを確認し、代表値としては中央値のほうが適していると考えられます。
期間内のデータ比較はどう?
さらに、対象となるのは2024年4月から3月までの期間の顧客データです。各顧客に対して毎月の支払額の単純平均と中央値を求め、また支払いの内訳に記載されている各顧客品番ごとの費用についても、同様に毎月の単純平均と中央値を算出して比較していきます。