データ比較はどう進める?
分析の基本原則は「比較」であり、まずはデータを比較する目的に立ち返ることが大切だと感じました。データ収集の前に仮説を設定し、その仮説を検証していくプロセスの中で、データをどのように加工して示すかという点が今回の学びのポイントでした。加工の視点としては、大きく代表値と散らばりの2つに分けられ、代表値には単純平均、加重平均、幾何平均、中央値があること、そして散らばりについては標準偏差で表現されることを学びました。
外れ値の対応はどうする?
今までは単純平均しか扱ったことがなく、重みを考慮した平均やべき乗を利用した手法は初めて触れる内容でした。また、平均値だけでは捉えきれない外れ値に対しては中央値を用いることで対応する方法がある点も新鮮でした。標準偏差については、なぜルートがつくのかという計算過程が理解でき、正規分布の場合にデータの約95%が±2個分の範囲に収まるという納得感を得ることができました。これまで平均を取るだけで思考が止まってしまっていた部分を、散らばりの視点からデータ活用の具体的なイメージに結び付けることができました。
移住データで何が見える?
また、人口減少対策において活用される移住者データを分析することへの関心が高まりました。各市町村の移住者データを様々な属性で分析し、特に年齢や家族構成の散らばりを調べることで、どの施策に注力すべきかを推測するひとつの手法となり得ると感じています。現状、移住促進施策はUターン促進とIターン促進の大別がなされており、例えばUターンでは地元を想う集まりの取り組みを強化し、Iターンではボランティアや副業などにより継続的な関わりを持つ関係人口への支援を強化するという方針です。こうした大まかな区分に加え、より具体的な属性の分析が進むことで、移住理由を数値的に捉え、具体的な施策検討に役立てることができそうです。
今後の分析計画は?
今後は、所管部署に対して詳細な個別データの入手が可能かどうか問い合わせる予定です。データが手に入れば、エクセルを用いた分析に取り組みたいと思っています。特に県全体と沿岸地域の違いを明らかにすることで、一緒に施策を進める市町村の担当者や移住コーディネーターの方々の取り組みにも影響を与えられるのではないかと感じています。5月20日(火)に、所管部署の担当者が意見交換に来訪する予定のため、その際にデータ入手の依頼を進めるつもりです。