業界別の年収を見てみた【python/データ分析】

rankouka

業界ごとに年収ってどの程度違いがあるのだろうか。

今回は東京の企業2000社のデータを使って、業界別の平均年収を見ていこうと思います。

世の中の平均年収が気になる方は、以前書いた記事を見てみてください。

使用するライブラリ

使用するライブラリは以下になります。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
from pandas import Series, DataFrame
from matplotlib.font_manager import FontProperties
fp = FontProperties(fname=r'C:\WINDOWS\Fonts\meiryob.ttc', size=16)

jupiterlabで項目を日本語表記できるようにする

pip install jupyterlab-language-pack-ja-JP

グラフを表記する時に、日本語表記にしたいので上記をインストールします。

用意したデータを見てみる

まず、用意したデータを見ていきたいと思います。

データの読込

read.csv()で用意したcsvファイルを読み込んでいきます。

df=pd.read_csv('data.csv',encoding='utf-8')

データの中身を確認する

それでは、用意したデータの中身を見ていきましょう。

df.info()

このデータの中には、2049社のデータが入っていることが分かります。

また、各会社の平均年収や月の残業時間などの情報も含まれていることが分かりますね。

業界別の平均年収を見てみる

用意したデータをグラフで可視化してみましょう。

データの中にどれだけの業界が含まれているか

まず、読み込んだデータの中にどれだけの業界が含まれているのか見てみます。

plt.figure(figsize=(20, 10))#グラフの大きさ
ax =sns.countplot('業界',data=df,label=False)# 棒グラフ
ax.set_xticklabels(ax.get_xticklabels(),rotation = 90)#項目を90度回転
plt.xlabel("業界", fontproperties=fp,fontsize=30) # x軸ラベル
plt.ylabel("会社数", fontproperties=fp,fontsize=30) # y軸ラベル
plt.title('業界別の会社数', fontproperties=fp,fontsize=30) # タイトル
plt.show()

データの中には、34種類の業界が含まれていることがわかりました。

無作為にデータを抽出したのですが、会社の数に偏りがありますね。

特に「情報・通信」「サービス」の2つの業界が多いことが分かります。

東京ではこの2つの業界が伸びていると言うことなのでしょうか。

業界別に平均年収の分布を確認する

次に箱ひげ図を使って、業界別の平均年収の分布を確認したいと思います。

plt.figure(figsize=(20,10))#グラフの大きさ
ax = sns.boxplot(x=df['業界'], y= df['平均年収'])
ax.set_xticklabels(ax.get_xticklabels(),rotation = 90)#項目を90度回転
plt.xlabel("業界", fontproperties=fp,fontsize=30) # x軸ラベル
plt.ylabel("平均年収", fontproperties=fp,fontsize=30) # y軸ラベル
plt.title('業界別平均年収', fontproperties=fp,fontsize=30) # タイトル
plt.show()

業界別の平均年収を見てみると、「証券業」が飛び抜けていますね。

今回扱っているデータの中では、「医薬品」「証券業」「石油・石炭製品」3つの業界の平均年収が安定して高いですね。

取得されたデータが多い「情報・通信」「サービス」2つの業界は、平均年収が高い会社と低い会社の開きが大きいです。そのため、業界としての平均年収は低めに出ているように思えます。

この2つの業界に入る時は、しっかりと会社を調べる必要があると言うことですね。

最後に

今回は東京の約2000社の企業を業界別に分けて、平均年収を見てみました。

無作為にデータを抽出したのですが、「情報・通信」「サービス」の2つの業界が多かったですね。

それだけ、この業界が伸びていると言うことなのでしょう。

業界別に平均年収を見てみましたが、「医薬品」「証券業」「石油・石炭製品」業界の平均年収が高かったように見えます。

私としては「情報・通信」業界の平均年収はもっと高いと思っていたので、少し驚いています。

グラフにしてみると、新しい発見があるので面白いですね。

コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA