RepoLog│レポログ

研究職サラリーマンが日々感じたことをレポートするブログです。

REPOLOG

日々感じたことをレポートするブログ

年収は対数正規分布に従うかグラフ化して検証してみよう

f:id:sekkachipapa:20170809110807p:plain

年収を偏差値化してくれるツール「年収偏差値チェッカー」がちょっとした話題になっています。

当ブログでも以前、2パターンの方法で年収を偏差値で表すことに挑戦しました。

パターン①:年収をそのまま利用する
パターン②:年収の対数を取り利用する

今回話題になっている年収偏差値チェッカーは、パターン①と同じで年収を変換することなくそのままの値で偏差値を算出しているようです。

一方、年収分布のように分布が片側に寄っている分布は、対数(Log)化することで正規分布に従うことが知られています。そこで、当ブログではパターン②として、年収の対数を用いた値で年収の偏差値化を行ってみました。

ただ、パターン②は年収の分布が対数正規分布に従っているという前提の下、計算をしただけであって、その分布図を公開していませんでした。

そこで本日は、年収の分布が本当に対数正規分布に従っているのかをグラフ化しながら確認することを目指してみたいと思います。

 

最新の年収調査を使った検証

f:id:sekkachipapa:20170809112629p:plain

ここでは最新の国民所得が把握できる調査報告平成28年国民生活基礎調査│厚生労働省を用いて検証してみることにします。

まず、上のヒストグラムを見てみると、分布が左側に偏っていることが見て取れます。こうした特長がある分布が対数席分布に従っていくようなので、第一段階はクリアです。

次に、年収の対数(log)を取った度数分布表を作成します。

対数化した度数分布表を作成

f:id:sekkachipapa:20170809115320p:plain

手順としては、

  1. 階級値を定める
  2. 階級値の対数(log)を取る
  3. 相対度数を転記する

を行うことで、上記の度数分布表が完成します。ここまでくれば、分布状況をエクセルでプロットすることができます。

正規分布になっているか確認

f:id:sekkachipapa:20170809115640p:plain

先ほどの度数分布表からLog値と相対度数をもとに得たグラフがこちらになります。確かに正規分布っぽくなっていますよね。本当はヒストグラムで分布図を作りたかったんですが、知識がなくできませんでした。

ちなみに、それぞれのパターンにおける平均所得は

  • 545万8,000円(そのまま)
  • 356万3,000円(対数) 

となり、状況が大きく異なることが見て取れます。

せっかくですので、最新の調査を用いて、パターン①(そのままの分布)での偏差値化とパターン②(対数正規分布)での偏差値化をそれぞれ行ってみることにしましょう。

偏差値を求めるために用いる計算式は、以下の式になります。

f:id:sekkachipapa:20170728155107j:plain

それぞれのパターンで年収を偏差値化

f:id:sekkachipapa:20170809132159p:plain

この表が年収をパターン①と②のそれぞれにおいて偏差値化したものです。同じ年収でも偏差値が大きくことなることが確認できます。

まとめ

まず本日の目標であった「年収の分布は対数正規分布に従うのか」については、「従いそうだ」という結論になりました。本来、この疑問に明確に答えるためには適合度検定が有効なのですが、ここでは分布図の見た目で判断させていただきました。

また、なぜわざわざ年収の対数を取り、パターン②のようなひと手間加えた算出方法を用いるのかというと、偏差値の性質を生かして状況を把握することにあります。

偏差値の重要な性質は、こちらの記事でまとめています。

パターン①ではこの性質が十分に機能しないため、出てきた数値にどのような意味があるのかを検討する必要があります。

年収偏差値にしろ、学力偏差値にしろ、その数値の持つ本質を捉え、次のアクションへつなげることが重要であり、人より高い・低いで一喜一憂するものではないことが伝えられたらうれしく思います。

 

最新レポート

レポート一覧

レポート一覧
TOP画面へ