ユビキタスで変わるマーケティング 

富士通研究所と博報堂は、「ショッピング情報配信プラットフォーム」の研究開
発共同プロジェクト「Smash Aid」を開始したことを発表した。

「消費者のPC、デジタルテレビ、携帯電話、ICカード等のデジタルメディアをシームレスに連動させるショッピング情報提供プラットフォームの研究開発を共同で推進していく」
そして、「メディア、メーカー、流通業の連携による消費行動の促進効果評価」するとある。マーケティングのROIがきっちりと計算出来る時代がやってくることになる。
消費行動モデルというのも、現在考えられているようなセグメント毎に代表的個人を仮定するというものから一歩も二歩も踏み出したものになっていくだろう。



トーマス・ベイズ Thomas Bayes( 1702 - 1761 ) 

長老教会派牧師にしてアマチュアの数学者。
不特定の条件下における特定の事象の発生確率を予測する統計理論を構築した。これがベイズ理論。
その理論は、彼の死後、1763年に「偶然の理論における1問題を解くための試み(Towards Solving a Problem in the Doctrine of Chances)」という論文で世に出た。
この論文の中の一文、「未来を推測するには過去を振り返らなければならない(To see the future, one must look at the past.)」は有名。

ベイズの定理は、事前確率 P(X)、事後確率 P(X|E)、尤度 P(E|X)として
P(X|E) = P(E|X)P(X) / P(E)
P(E) = Σ P(E|X)P(X)
と表現される。

同じ定式化はピエール・シモン・ラプラス(1749-1827)によってもなされている。しかし、フィッシャー(1857-1936)とK・ピアソン(1857-1936)らによって一旦はベイズ統計は非主流とされた。
このように確率が逐次的に修正されていくという考え方は客観的科学とは相容れないと考えられたのか、あるいは、その理論の提唱者がアマチュアであり、しかも、生前には、神の存在を方程式で説明できると主張していたような人物であったためだろうか。
ともかくも、一時期はトンデモ科学と見なされてきたベイズ統計は、第二次大戦後にD・V・リンドレイや A・ワルド、L・J・サベージらによって、科学として息を吹き返した。

ベイズの考え方 

ある消費者がコカ・コーラが好きなのかペプシが好きなのか確かめたいとしよう。
コカ・コーラが好きな可能性を70%、ペプシが好きな可能性が25%と仮定する。これが事前確率ということになる。
この消費者がコカ・コーラが好きだという場合に、コカ・コーラを購入する可能性が70%。逆に、本当はペプシが好きなのにコーラを購入する可能性が30%としてみよう。
これが、いわゆる尤度ということになる。

で、実際に、この消費者がコカ・コーラを購入したとしよう。
コカ・コーラが好きだという場合
70%×70%=49%
ペプシが好きだという場合
25%×30%=7.5%
両方を足した56.5%が全ての可能性ということになる。
そうすると、この消費者がコカ・コーラが好きだという可能性(事後確率)は
49% ÷ 56.5% = 86.7%
ペプシが好きな可能性は
7.5% ÷ 56.5% = 13.3%
ということで、この消費者が実際にコカ・コーラを購入したということで、この消費者がコカ・コーラが好きだという可能性が70%から86.7%に上方修正されたということになる。これを主観確率の修正という。


Rによるコレスポンデンス分析 

次のような集計表があったとします。

これをコレスポンデンス分析してみましょう。
Stephane Dray氏によるCoCoAn: Constrained Correspondence Analysis をダウンロード。
解凍してlibraryにフォルダを丸ごとコピー。
Rを立ち上げて、
> library(C0CoAn);
> L <- matrix(c(4,2,1,3,2,5,1,3,2,4,3,2,2,1,3,1),4,4)
> L
> M <- CAIV(L);
> CAIV.plot(M, x=1, y=2, add.row=TRUE, add.col=TRUE, add.var=FALSE,
row.names="", col.names="", var.names="");

とすると、


ev:a vector containing eigenvalues
B:coecients of variables of E (only in constrained analysis)
D:covariance matrix between external variables and row scores (only in constrained
analysis)
R:row coordinates of unit variance
F:column coordinates of variance ev[i]

コレスポンデンス分析 

Correspondence Analysis
カテゴリー間の関係を視覚化するデータ解析手法。
集計済みのクロス表(contingency table)の行の要素と列の要素の相関関係が最大になるように数量化し、その行の要素と、列の要素を散布図に表現する。通常は、「重み付きユークリッド距離」で計算される。

重み付きユークリッド距離
d2 = Σ wi (xi - yi)2

利用される重みは分析対象である頻度行列のカイ2乗距離を平面上で近似するように計算される。

数理的には林知己夫先生が開発した数量化理論第�類と同じ。
但し、次のような相違がある。


[参考文献]
Greenacre(1984)Theory and Application of Correspondence Analysis.Academic Press.Clausen (1988)Applied Correspondence Analysis , An Introduction.SAGE.
林知己夫(1993)数量化−理論と方法−.朝倉書店



This page is powered by Blogger. Isn't yours?