研究の概要
顧客との長い良好な関係を構築するために、顧客行動やその変化の検出が必要である。本論文では、アソシエーションルール分析により抽出される顧客行動(ルール)について、その行動やその変化の類似性や意外性を図る指標を提案する。既存研究では、抽出される顧客行動の帰結部の長さが1に限られていたが、本研究では1以上に拡張された。
内容
顧客行動の変化を表す4つの分類
変化を示すものは次の4つに分類される。それぞれ、異なる時期のデータセットに対してアソシエーションルール分析を実施し確認するものである。
- Emerging patterns
異なる時期のデータセットでの、ルールのsupportの変化。supportが増加するなら顧客行動はロバストになっていることを示し、減少しているなら弱くなっていることを示す。
- Added patterns
新しいデータセットにおいて、過去のデータセットに見られない/顕著に異なるルールを指す。Rule Matching Threshold(RMT)と呼ばれる適当な閾値を用いて類似性を図る。
- Perished patterns
過去のデータセットには存在したが、新しいデータセットには存在しないルール。(前提・帰結部ともに全く異なるルール)。
- Unexpected changes
後述の指標に基づき、予期せぬ前提・予期せぬ帰結の変化を指す。
(参考)指標の記述のために用いる変数
クリックで詳細表示
・$r_i^{t_1}$:時刻$t_1$のデータセットより抽出されたルール$i$
・$r_j^{t_2}$:時刻$t_2$のデータセットより抽出されたルール$j$
・$|M_i^{t_1}|$:$r_i^{t_1}$の前提部の長さ
・$|M_j^{t_2}|$:$r_j^{t_1}$の前提部の長さ
・$|X_{ijp}|$:$r_i^{t_1}, r_j^{t_2}$の前提部で共通するアイテムの属性$p$の値が一致すれば$1$、一致しなければ$0$となる変数。
・$|N_i^{t_1}|$:$r_i^{t_1}$の結論部の長さ
・$|N_j^{t_2}|$:$r_j^{t_1}$の結論部の長さ
・$|Y_{ijp}|$:$r_i^{t_1}, r_j^{t_2}$の結論部出共通するアイテムの属性$p$の値が一致すれば$1$、一致しなければ$0$となる変数。
提案する2つの指標
本論文では、各ルールを上記の変化に分類するために以下の2つの指標を提案した。
1. 類似性
$r_i^{t_1}, r_j^{t_2}$の類似性$S_{ij}$を以下のように定義する。
ただし$S_{ij}$は$0$以上$1$以下の値を取り、$0$であれば2つルールは完全に異なっており、$1$であれば完全に一致している。式の前半部分は前提部の、後半部分は帰結部分の類似性を表している。
また各ルールの最大類似度を$S_{i}^{t_1} = \max_j {S_{ij}} \,, S_{j}^{t_2} = \max_i {S_{ij}}$とする。意思決定者が適切に前述の$RMT$を決めることで、$S_i^{t_1} \le RMT$を満たす$r_i^{t_1}$はPerished patternsを意味し、$RMT \le S_j^{t_2}$はAdded patternsを意味する。
2. 予期せぬ変化
$r_i^{t_1}, r_j^{t_2}$の予期せぬ変化$\delta_{ij}^{'}$を以下のように定義する。
$\delta_{ij} > 1$ ならば帰結部に意外な変化があることを示し、$\delta_{ij} < 0$ならば前提部に意外な変化があることを示す。$\delta_{ij} = 0$の場合は、2つのルールが全く異なるか同一であることを示している。$\delta_{ij}$では、異なる時刻において、他に同じルールが存在しているかどうか(Emerging patterns)を考慮できていないため、$\delta_{ij}^{'}$を考える。
$\delta_{ij}^{'} = 0$となる場合は、2つのルールが全く異なる/同一又は他に同一ルールが存在することを示す。この$\delta_{ij}^{'}$に対して適切な$RMT$を定め、$\delta_{ij}^{'} \ge RMT$となる場合、$r_j^{t_2}$は$r_i^{t_1}$に対してUnexpected changesと言える。($RMT$は$1$と定めると良い。)