いろいろやってみるにっき

なんとか自分の会社を立ち上げるところまで漕ぎ着けた、てきとーに生きている奴の日記

関連記事を探すときは、読んだ記事と同じカテゴリをクリックしてください。

記事のカテゴリは記事タイトル下に表示されています。カテゴリ一覧はサイドバーにあります。


CCCが面白いデータを公開していたので分析をしてみた(年齢分布とコンビニ再調査編) #CCC

まだ年齢分布以外に強い相関を示すデータは無い。というわけで未だ分析に至らずである。

下記のExcelデータはCC BY NC SAということで、その範囲内でご自由にお使い頂いて結構。Excel Onlineからダウンロードできるはず。Excel Online表示部分の右下最も左のアイコンがダウンロードアイコン。

年齢分布の男性のみデータ

前回に引き続き年齢分布の男性のみデータから。

 強い正の相関を示すのは35~39歳及び45~49歳。間に挟まっている40~44歳も0.635173なので正の相関。25歳~54歳までは正の相関、あるいは強い正の相関という結果である。

一方、60歳~69歳までは強い負の相関。還暦を過ぎてまだ働いている人もいそうな年代は、Tカードに縁がなさそうである。

f:id:shigeo-t:20151023043952p:plain

f:id:shigeo-t:20151023044016p:plain

f:id:shigeo-t:20151023044029p:plain

女性の場合30歳~39歳に強い相関があるのに対し、男性の場合は少し年齢層が高い。

コンビニ再調査

コンビニは初回ファミリーマート(以下ファミマ)の店舗数を数えてみたのだが、弱い相関しかなくあてが外れた。今回はセブンイレブン(以下セブン)、ローソンのデータも拾ってみた。

都道府県別のデータは各社の店舗数データから拾った。

店舗数|会社案内|企業情報|FamilyMart 2015年9月現在

国内外店舗数|セブン‐イレブン~近くて便利~ 2015年9月末現在

売上高/店舗数|ローソン 2015年2月末現在

ローソンだけはデータが古いのだが、なんでだろう。半年もあれば相当店舗数に変動がありそうだが。

都内の店舗数だが、下記から拾った。

ファミマ、セブン、ローソン以外にサークルKサンクスデイリーヤマザキミニストップ、その他という拾い方をしている。サークルKサンクスデイリーヤマザキミニストップは今回は全部その他に集計した。近い将来に見えている合従連衡は、考慮しないことにしたわけである。

ページ下部に

東京都23区内のコンビニ データはYahoo!ローカルサーチAPIを通して集めました

とあるので、Yahoo!ローカルサーチAPIで拾える範囲のデータということになる。上記URLからデータをダウンロードしてみると分かるが、ダブリデータが数百件規模で存在する。あと、二重に店舗入力されているのだがスペースの入り方が違うというデータもあった。これも分かる範囲で排除した。

またLongitude、Latitudeが入っているが、もしかすると数値がおかしいかも。下記ツールで住所にコンバートしたのだが、埼玉県や千葉県、神奈川県に判別される店舗が多かった。使用したツールは下記のWindows上で動くもの。

ツールが悪いのか、ツールが合わない(対応する測地系ではない)のか、データがおかしいのかは分からない。結局手で直した。

 相関を見ていくと、23区、都道府県、通しで異なる結果ができている。

23区はファミマに正の相関がある。都道府県でみると弱い正の相関となる。これが通しでみると打ち消し合うようで相関無しになってしまう。セブンは都道府県のみ弱い正の相関がある。

ローソンは23区、都道府県ともに弱い正の相関。これは想像してみると、ファミマ、ローソンはそれぞれポイントカードのTカードとPonta。ローソンはPonta採用前はTカードと提携していたということもあるんだろう。ポイントカード好き(購買情報を取られてもポイントもらえる方がうれしい)は、何枚もポイントカードを持っていそうな気がする。

一方のセブンはnanacoだが純然たるポイントカードではなく、主機能は電子マネー。そういやセブンのレジで「ポイントカードはございますか」は無いような気がする。うろ覚えだが。

f:id:shigeo-t:20151023042609p:plain

 今度は足し算。順列組合せで2チェーンの足し算と3チェーンの足し算を見てみる。23区のファミマ+ローソンは正の相関。それ以外の23区、都道府県それぞれのデータは弱い正の相関。通しでみると相関無しなのは上の個別データと同じ。打ち消しあっちゃうんだろう。

f:id:shigeo-t:20151023042551p:plain

 最後はファミマ:(セブン+ローソン)レシオと、3コンビニ中の各チェーン比率。都道府県は相関無し。23区と通しで正の相関。都道府県だと他のローカルチェーン(ポプラやセイコーマートなど)が強い地域があるからかもしれない。

セブンの23区は負の相関。ローソンは都道府県と通しで負の相関。セブン+ローソンで見ると23区と通しで負の相関。

f:id:shigeo-t:20151023043036p:plain

 こうやって見ていくと、店舗数ではなく比率で見るべきだろう。ファミマが強い地域ではTカードが強く、他の2チェーン合計が強い地域ではTカードが弱いといえる。

都道府県ではファミマ以外の提携企業がTカード普及に寄与している可能性がある。

他のコンビニチェーンも拾えれば都道府県の相関は異なる結果かもしれない。

 過去エントリ