いろいろやってみるにっき

てきとーに生きている奴の日記

古いエントリのサムネイル画像がリンク切れになってたりするけど、チマチマ修正中


CCCが面白いデータを公開していたので分析をしてみた(年齢分布とコンビニ再調査編) #CCC

まだ年齢分布以外に強い相関を示すデータは無い。というわけで未だ分析に至らずである。

下記のExcelデータはCC BY NC SAということで、その範囲内でご自由にお使い頂いて結構。Excel Onlineからダウンロードできるはず。Excel Online表示部分の右下最も左のアイコンがダウンロードアイコン。

年齢分布の男性のみデータ

前回に引き続き年齢分布の男性のみデータから。

 強い正の相関を示すのは35~39歳及び45~49歳。間に挟まっている40~44歳も0.635173なので正の相関。25歳~54歳までは正の相関、あるいは強い正の相関という結果である。

一方、60歳~69歳までは強い負の相関。還暦を過ぎてまだ働いている人もいそうな年代は、Tカードに縁がなさそうである。

f:id:shigeo-t:20151023043952p:plain

f:id:shigeo-t:20151023044016p:plain

f:id:shigeo-t:20151023044029p:plain

女性の場合30歳~39歳に強い相関があるのに対し、男性の場合は少し年齢層が高い。

コンビニ再調査

コンビニは初回ファミリーマート(以下ファミマ)の店舗数を数えてみたのだが、弱い相関しかなくあてが外れた。今回はセブンイレブン(以下セブン)、ローソンのデータも拾ってみた。

都道府県別のデータは各社の店舗数データから拾った。

店舗数|会社案内|企業情報|FamilyMart 2015年9月現在

国内外店舗数|セブン‐イレブン~近くて便利~ 2015年9月末現在

売上高/店舗数|ローソン 2015年2月末現在

ローソンだけはデータが古いのだが、なんでだろう。半年もあれば相当店舗数に変動がありそうだが。

都内の店舗数だが、下記から拾った。

ファミマ、セブン、ローソン以外にサークルKサンクスデイリーヤマザキミニストップ、その他という拾い方をしている。サークルKサンクスデイリーヤマザキミニストップは今回は全部その他に集計した。近い将来に見えている合従連衡は、考慮しないことにしたわけである。

ページ下部に

東京都23区内のコンビニ データはYahoo!ローカルサーチAPIを通して集めました

とあるので、Yahoo!ローカルサーチAPIで拾える範囲のデータということになる。上記URLからデータをダウンロードしてみると分かるが、ダブリデータが数百件規模で存在する。あと、二重に店舗入力されているのだがスペースの入り方が違うというデータもあった。これも分かる範囲で排除した。

またLongitude、Latitudeが入っているが、もしかすると数値がおかしいかも。下記ツールで住所にコンバートしたのだが、埼玉県や千葉県、神奈川県に判別される店舗が多かった。使用したツールは下記のWindows上で動くもの。

ツールが悪いのか、ツールが合わない(対応する測地系ではない)のか、データがおかしいのかは分からない。結局手で直した。

 相関を見ていくと、23区、都道府県、通しで異なる結果ができている。

23区はファミマに正の相関がある。都道府県でみると弱い正の相関となる。これが通しでみると打ち消し合うようで相関無しになってしまう。セブンは都道府県のみ弱い正の相関がある。

ローソンは23区、都道府県ともに弱い正の相関。これは想像してみると、ファミマ、ローソンはそれぞれポイントカードのTカードとPonta。ローソンはPonta採用前はTカードと提携していたということもあるんだろう。ポイントカード好き(購買情報を取られてもポイントもらえる方がうれしい)は、何枚もポイントカードを持っていそうな気がする。

一方のセブンはnanacoだが純然たるポイントカードではなく、主機能は電子マネー。そういやセブンのレジで「ポイントカードはございますか」は無いような気がする。うろ覚えだが。

f:id:shigeo-t:20151023042609p:plain

 今度は足し算。順列組合せで2チェーンの足し算と3チェーンの足し算を見てみる。23区のファミマ+ローソンは正の相関。それ以外の23区、都道府県それぞれのデータは弱い正の相関。通しでみると相関無しなのは上の個別データと同じ。打ち消しあっちゃうんだろう。

f:id:shigeo-t:20151023042551p:plain

 最後はファミマ:(セブン+ローソン)レシオと、3コンビニ中の各チェーン比率。都道府県は相関無し。23区と通しで正の相関。都道府県だと他のローカルチェーン(ポプラやセイコーマートなど)が強い地域があるからかもしれない。

セブンの23区は負の相関。ローソンは都道府県と通しで負の相関。セブン+ローソンで見ると23区と通しで負の相関。

f:id:shigeo-t:20151023043036p:plain

 こうやって見ていくと、店舗数ではなく比率で見るべきだろう。ファミマが強い地域ではTカードが強く、他の2チェーン合計が強い地域ではTカードが弱いといえる。

都道府県ではファミマ以外の提携企業がTカード普及に寄与している可能性がある。

他のコンビニチェーンも拾えれば都道府県の相関は異なる結果かもしれない。

 過去エントリ

お時間あったら、他のエントリもクリックして頂ければ幸いです。