今回いくつかデータの相関を見てみたが、なんか前2回の年齢別データ以外に強い相関は出ないんじゃないかという気がしてきた。 「分析してみた」なんてタイトルを付けたのを後悔している。まだまだデータ探しは続きそう。
今回3つのテーブルを作ってみたが、2つはRESASから。
労働生産性
RESASでいくつかデータを探してみたところ、労働生産性が都道府県別、市区町村別でデータを入手できた。中分類までデータはあるのだが、手間暇の都合で大分類で相関を見てみた。大分類は18。
例によって見て分かるように相関の値については色分けをした。
- 赤 相関なし:0~0.2
- 黄 やや相関あり:0.2~0.4
- 緑 相関あり:0.4~0.7
割と緑が多いが、前々回の生産年齢人口のような強い相関は無かった。逆に完全に赤(相関なし)で揃うのは電気・ガス・熱供給・水道業のみ。業種間の特性などもあまり近似性が見えてきていない。もう少し眺めてみたい。
卸売業、小売業なんかは、Tカードと親和性の高い業種なので緑が2つ来ているのは納得感があるのだが、都道府県が黄色なんで判断が難しい。
それはそうと、港区の農業、林業の数字が突出していて、この数字がすごく気になる。どういうカラクリなんだろう。オートメーションの工場で野菜「製造」とか、そんな感じなんだろうか。
その他サービス業はhttp://www.stat.go.jp/index/seido/sangyo/pdf/19san3r.pdfに含まれる中分類が記載されている。
賃金
賃金で特性を見たいと思ったのだが、RESASでは都道府県レベルのデータしか無かった。市区町村データが無いので、23区は相関を見ることができない。23区はTカードの普及率は山の手側が高くなっているので、23区こそ賃金でデータを見たかったのだが。東京都の統計データにも見つけることができなかった。鋭意調査していく。
やや相関ありがいわゆる労働者人口で並ぶ。これを見ていると賃金の差はやや関係があるという程度のようだ。全年齢計を一番右に配置しているが、この数字も0.33台。300万円台が上位にも下位にもいるし、同じように400万円台も上位、中位、下位にバラけているので当然相関は高くならない。やはり愛知や大阪といった大都市圏を含む都道府県が中位、下位にいるせいかもしれない。
昼夜人口
23区の賃金データを探していて、昼夜人口が目に留まったので23区分だけ見てみた。結論からいえば、0.22台でギリギリやや相関ありである。
千代田区は1533.6で昼夜人口比率でダントツである。続く中央区、港区が400ポイント台である。千代田区はほとんど住んでいる人がいなくて、昼は夜の15倍も人がいるということになる。このデータの出所は下記である。
といったわけで
まだデータ探しは続きそうである。多軸でも見た方がいいのかもしれないが、まずはデータを探してみたい。やっぱり年齢だけなんだろうか。