いろいろやってみるにっき

てきとーに生きている奴の日記

古いエントリのサムネイル画像がリンク切れになってたりするけど、チマチマ修正中


CCCが面白いデータを公開していたので分析をしてみた(賃金/労働生産性編) #CCC

今回いくつかデータの相関を見てみたが、なんか前2回の年齢別データ以外に強い相関は出ないんじゃないかという気がしてきた。 「分析してみた」なんてタイトルを付けたのを後悔している。まだまだデータ探しは続きそう。

今回3つのテーブルを作ってみたが、2つはRESASから。 

労働生産性

 RESASでいくつかデータを探してみたところ、労働生産性都道府県別、市区町村別でデータを入手できた。中分類までデータはあるのだが、手間暇の都合で大分類で相関を見てみた。大分類は18。

 例によって見て分かるように相関の値については色分けをした。

  • 赤 相関なし:0~0.2
  • 黄 やや相関あり:0.2~0.4
  • 緑 相関あり:0.4~0.7

割と緑が多いが、前々回の生産年齢人口のような強い相関は無かった。逆に完全に赤(相関なし)で揃うのは電気・ガス・熱供給・水道業のみ。業種間の特性などもあまり近似性が見えてきていない。もう少し眺めてみたい。

 卸売業、小売業なんかは、Tカードと親和性の高い業種なので緑が2つ来ているのは納得感があるのだが、都道府県が黄色なんで判断が難しい。

それはそうと、港区の農業、林業の数字が突出していて、この数字がすごく気になる。どういうカラクリなんだろう。オートメーションの工場で野菜「製造」とか、そんな感じなんだろうか。

その他サービス業はhttp://www.stat.go.jp/index/seido/sangyo/pdf/19san3r.pdfに含まれる中分類が記載されている。

賃金

賃金で特性を見たいと思ったのだが、RESASでは都道府県レベルのデータしか無かった。市区町村データが無いので、23区は相関を見ることができない。23区はTカードの普及率は山の手側が高くなっているので、23区こそ賃金でデータを見たかったのだが。東京都の統計データにも見つけることができなかった。鋭意調査していく。

 やや相関ありがいわゆる労働者人口で並ぶ。これを見ていると賃金の差はやや関係があるという程度のようだ。全年齢計を一番右に配置しているが、この数字も0.33台。300万円台が上位にも下位にもいるし、同じように400万円台も上位、中位、下位にバラけているので当然相関は高くならない。やはり愛知や大阪といった大都市圏を含む都道府県が中位、下位にいるせいかもしれない。

昼夜人口

23区の賃金データを探していて、昼夜人口が目に留まったので23区分だけ見てみた。結論からいえば、0.22台でギリギリやや相関ありである。

千代田区は1533.6で昼夜人口比率でダントツである。続く中央区、港区が400ポイント台である。千代田区はほとんど住んでいる人がいなくて、昼は夜の15倍も人がいるということになる。このデータの出所は下記である。

 

といったわけで

まだデータ探しは続きそうである。多軸でも見た方がいいのかもしれないが、まずはデータを探してみたい。やっぱり年齢だけなんだろうか。

TSUTAYAの謎

TSUTAYAの謎

 
みんなのR データ分析と統計解析の新しい教科書

みんなのR データ分析と統計解析の新しい教科書

 
お時間あったら、他のエントリもクリックして頂ければ幸いです。