【備忘】Mining changes in customer behavior in retail marketing

研究の概要

顧客との長い良好な関係を構築するために、顧客行動やその変化の検出が必要である。本論文では、アソシエーションルール分析により抽出される顧客行動(ルール)について、その行動やその変化の類似性や意外性を図る指標を提案する。既存研究では、抽出される顧客行動の帰結部の長さが1に限られていたが、本研究では1以上に拡張された。

内容
顧客行動の変化を表す4つの分類

変化を示すものは次の4つに分類される。それぞれ、異なる時期のデータセットに対してアソシエーションルール分析を実施し確認するものである。

  • Emerging patterns

 異なる時期のデータセットでの、ルールのsupportの変化。supportが増加するなら顧客行動はロバストになっていることを示し、減少しているなら弱くなっていることを示す。

  • Added patterns

 新しいデータセットにおいて、過去のデータセットに見られない/顕著に異なるルールを指す。Rule Matching Threshold(RMT)と呼ばれる適当な閾値を用いて類似性を図る。

  • Perished patterns

 過去のデータセットには存在したが、新しいデータセットには存在しないルール。(前提・帰結部ともに全く異なるルール)。

  • Unexpected changes

 後述の指標に基づき、予期せぬ前提・予期せぬ帰結の変化を指す。

(参考)指標の記述のために用いる変数

クリックで詳細表示 ・$r_i^{t_1}$:時刻$t_1$のデータセットより抽出されたルール$i$
・$r_j^{t_2}$:時刻$t_2$のデータセットより抽出されたルール$j$
・$|M_i^{t_1}|$:$r_i^{t_1}$の前提部の長さ
・$|M_j^{t_2}|$:$r_j^{t_1}$の前提部の長さ
・$|X_{ijp}|$:$r_i^{t_1}, r_j^{t_2}$の前提部で共通するアイテムの属性$p$の値が一致すれば$1$、一致しなければ$0$となる変数。
・$|N_i^{t_1}|$:$r_i^{t_1}$の結論部の長さ
・$|N_j^{t_2}|$:$r_j^{t_1}$の結論部の長さ
・$|Y_{ijp}|$:$r_i^{t_1}, r_j^{t_2}$の結論部出共通するアイテムの属性$p$の値が一致すれば$1$、一致しなければ$0$となる変数。

提案する2つの指標

本論文では、各ルールを上記の変化に分類するために以下の2つの指標を提案した。
1. 類似性
$r_i^{t_1}, r_j^{t_2}$の類似性$S_{ij}$を以下のように定義する。


\begin{aligned}
S_{ij}  \triangleq \frac{\Sigma_p |X_{ijp}|}{\max\{|M_i^{t_1}|, |M_i^{t_2}| \}} \times \frac{\Sigma_p |Y_{ijp}|}{\max\{|N_i^{t_1}|, |N_i^{t_2}| \}} \notag
\end{aligned}

 ただし$S_{ij}$は$0$以上$1$以下の値を取り、$0$であれば2つルールは完全に異なっており、$1$であれば完全に一致している。式の前半部分は前提部の、後半部分は帰結部分の類似性を表している。
 また各ルールの最大類似度を$S_{i}^{t_1} = \max_j {S_{ij}} \,, S_{j}^{t_2} = \max_i {S_{ij}}$とする。意思決定者が適切に前述の$RMT$を決めることで、$S_i^{t_1} \le RMT$を満たす$r_i^{t_1}$はPerished patternsを意味し、$RMT \le S_j^{t_2}$はAdded patternsを意味する。

2. 予期せぬ変化
$r_i^{t_1}, r_j^{t_2}$の予期せぬ変化$\delta_{ij}^{'}$を以下のように定義する。


\begin{aligned}
\delta_{ij} = \frac{\Sigma_p |X_{ijp}|}{\max\{|M_i^{t_1}|, |M_i^{t_2}| \}} - \frac{\Sigma_p |Y_{ijp}|}{\max\{|N_i^{t_1}|, |N_i^{t_2}| \}} \notag \\
\end{aligned} \\
\begin{equation} 
k_{ij} =
\left\{ 
    \begin{alignedat}{2}
     1 \quad &\text{if} \quad \max\{S_{i}^{t_1}, S_{j}^{t_2} \} = 1 \\
     0 \quad &\text{otherwise}
    \end{alignedat}
\right.
\end{equation} \\
\begin{aligned}
\delta_{ij}^{'} \triangleq | \delta_{ij} | -k_{ij}
\end{aligned}

 $\delta_{ij} > 1$ ならば帰結部に意外な変化があることを示し、$\delta_{ij} < 0$ならば前提部に意外な変化があることを示す。$\delta_{ij} = 0$の場合は、2つのルールが全く異なるか同一であることを示している。$\delta_{ij}$では、異なる時刻において、他に同じルールが存在しているかどうか(Emerging patterns)を考慮できていないため、$\delta_{ij}^{'}$を考える。
 $\delta_{ij}^{'} = 0$となる場合は、2つのルールが全く異なる/同一又は他に同一ルールが存在することを示す。この$\delta_{ij}^{'}$に対して適切な$RMT$を定め、$\delta_{ij}^{'} \ge RMT$となる場合、$r_j^{t_2}$は$r_i^{t_1}$に対してUnexpected changesと言える。($RMT$は$1$と定めると良い。)

参考文献

Chen, Mu-Chen, Ai-Lun Chiu, and Hsu-Hwa Chang. "Mining changes in customer behavior in retail marketing." Expert Systems with Applications 28.4 (2005): 773-781.