いろいろやってみるにっき

てきとーに生きている奴の日記

古いエントリのサムネイル画像がリンク切れになってたりするけど、チマチマ修正中


CCCが面白いデータを公開していたので分析をしてみた(とりあえずデータ起こし編)

データ作るだけで力尽きたので、タイトルに反して分析は未完成である。CCCが公開しているデータは下記。

経営者の皆様。その答えは、Tカードです。|カルチュア・コンビニエンス・クラブ株式会社

変わると困るので魚拓も確保。

知った経緯はこのツイート。

 

で、こんなデータが画像で置いてある。

http://www.ccc.co.jp/answer/img/img_rank.gif

http://www.ccc.co.jp/answer/img/img_map.jpg

これだと分析もなにもできないのでExcelにデータ起こし。切っ掛けは港区・世田谷区の住人がホイホイ購買情報を渡すんだろうかという疑念から。

 

ついでに年齢別人口とTSUTAYAファミリーマート(以下ファミマ)の店舗数までを入力。 データの引用元は下記の通り。

Excelは下記。

 データ作成の際、全国と東京都では年齢区分が異なり、全国は5歳刻みで千人単位。一方東京都は0~14歳、15~64歳、65~歳の3区分。そこで、東京都のデータは千人単位に丸めた。丸めはROUNDUP関数を使用。全国のほうは、東京都と合わせる形で年齢区分単位に合算した。こういう分析するなら全国の5歳区切りのほうがいいんだけど、東京都23区が3区分しかないので仕方ない。

人口データはいずれも男女別のデータがあるのだが、今回は男女合算にしている。単にマンパワーの問題。

人口データについては最初手で転記していたのだが、VLOOKUP関数で引用する形に直した。一部手入力が残っているのは力尽きたため。

 

最初TSUTAYA店舗数だけで見たのだが、計算する前から相関が無さそうに見えたので、ファミマも追加。普通の生活だと、TSUTAYAに行くよりもコンビニのほうがFrequencyが高いだろうという予測から。

 

店舗と生産年齢人口は、1店舗あたりの生産人口ということで人口/店舗数で計算。逆の店舗数/人口のほうがよさそうなのだが、数字が小さくなって比べにくいので逆にした。

 

で、CORREL関数で相関を3種類みてみた。

  1. Tカード普及率と生産年齢人口%
  2. Tカード普及率とTSUTAYA1店舗あたりの生産年齢人口[千人]
  3. Tカード普及率とファミマ1店舗あたりの生産年齢人口[千人]

それぞれ数字は下記の通り。Excel内もSheet1の表外下にそれぞれ計算結果がある。

  1. 0.7519
  2. -0.2178
  3. -0.2450

#2,3については、頑張って数字を拾って入力したのにその甲斐も無くorz、ほぼ無相関といえる。使う場所の多さと普及率には相関があるんじゃないかと予想したんだが。もちろんTカードが使える場所は経営者の皆様。その答えは、Tカードです。|カルチュア・コンビニエンス・クラブ株式会社に各社のロゴが貼ってあり、総利用可能店舗数は39万3210店。ファミマの1万3,000店超は約3%に過ぎないので、もう少し店舗数は拾わないと相関の有無の判定はできない。

 

一方#1の「Tカード普及率と生産年齢人口%」は、0.7519あるので強い相関といえる。その地域でTカードを持ちそうな年齢である15~64歳の割合が多いと、Tカードの普及率も高いということになる。

 

上のExcelデータはCC BY NC SAということで、その範囲内でご自由にお使い頂いて結構。Excel Onlineからダウンロードできるはず。Excel Online表示部分の右下最も左のアイコンがダウンロードアイコン。

 

■2015/10/05追記 人口データ差し替え 

EXCELマーケティングリサーチ&データ分析 [ビジテク]2013/2010/2007対応

EXCELマーケティングリサーチ&データ分析 [ビジテク]2013/2010/2007対応

 
お時間あったら、他のエントリもクリックして頂ければ幸いです。