いろいろやってみるにっき

なんとか自分の会社を立ち上げるところまで漕ぎ着けた、てきとーに生きている奴の日記

関連記事を探すときは、読んだ記事と同じカテゴリをクリックしてください。

記事のカテゴリは記事タイトル下に表示されています。カテゴリ一覧はサイドバーにあります。


CCCが面白いデータを公開していたので分析をしてみた(賃金/労働生産性編) #CCC

今回いくつかデータの相関を見てみたが、なんか前2回の年齢別データ以外に強い相関は出ないんじゃないかという気がしてきた。 「分析してみた」なんてタイトルを付けたのを後悔している。まだまだデータ探しは続きそう。

今回3つのテーブルを作ってみたが、2つはRESASから。 

労働生産性

 RESASでいくつかデータを探してみたところ、労働生産性都道府県別、市区町村別でデータを入手できた。中分類までデータはあるのだが、手間暇の都合で大分類で相関を見てみた。大分類は18。

 例によって見て分かるように相関の値については色分けをした。

  • 赤 相関なし:0~0.2
  • 黄 やや相関あり:0.2~0.4
  • 緑 相関あり:0.4~0.7

割と緑が多いが、前々回の生産年齢人口のような強い相関は無かった。逆に完全に赤(相関なし)で揃うのは電気・ガス・熱供給・水道業のみ。業種間の特性などもあまり近似性が見えてきていない。もう少し眺めてみたい。

 卸売業、小売業なんかは、Tカードと親和性の高い業種なので緑が2つ来ているのは納得感があるのだが、都道府県が黄色なんで判断が難しい。

それはそうと、港区の農業、林業の数字が突出していて、この数字がすごく気になる。どういうカラクリなんだろう。オートメーションの工場で野菜「製造」とか、そんな感じなんだろうか。

その他サービス業はhttp://www.stat.go.jp/index/seido/sangyo/pdf/19san3r.pdfに含まれる中分類が記載されている。

賃金

賃金で特性を見たいと思ったのだが、RESASでは都道府県レベルのデータしか無かった。市区町村データが無いので、23区は相関を見ることができない。23区はTカードの普及率は山の手側が高くなっているので、23区こそ賃金でデータを見たかったのだが。東京都の統計データにも見つけることができなかった。鋭意調査していく。

 やや相関ありがいわゆる労働者人口で並ぶ。これを見ていると賃金の差はやや関係があるという程度のようだ。全年齢計を一番右に配置しているが、この数字も0.33台。300万円台が上位にも下位にもいるし、同じように400万円台も上位、中位、下位にバラけているので当然相関は高くならない。やはり愛知や大阪といった大都市圏を含む都道府県が中位、下位にいるせいかもしれない。

昼夜人口

23区の賃金データを探していて、昼夜人口が目に留まったので23区分だけ見てみた。結論からいえば、0.22台でギリギリやや相関ありである。

千代田区は1533.6で昼夜人口比率でダントツである。続く中央区、港区が400ポイント台である。千代田区はほとんど住んでいる人がいなくて、昼は夜の15倍も人がいるということになる。このデータの出所は下記である。

 

といったわけで

まだデータ探しは続きそうである。多軸でも見た方がいいのかもしれないが、まずはデータを探してみたい。やっぱり年齢だけなんだろうか。

TSUTAYAの謎

TSUTAYAの謎

 
みんなのR データ分析と統計解析の新しい教科書

みんなのR データ分析と統計解析の新しい教科書