Apriori-Algorithmus:
Durch den Apriori-Algorithmus kann man aus mehreren Einkäufen eine Auflistung der häufig zusammen
vorkommenden Items herausfinden.
Zuerst wird jedes Item einzeln überprüft, ob dessen Support größer
als der Schwellensupport ist. Danach werden mit den übrigen
1-elementigen Itemsets, 2-elementige Itemsets
gebildet und wieder mit dem Schwellensupport verglichen, dann 3-elementige Itemsets
aus den
übriggebliebenen 2-elementigen Itemsets usw. bis keine Kombination mehr übrig bleibt, die den
nötigen Schwellensupport hat oder es
nicht mehr möglich ist, eine weitere neue Kombination zu erstellen.
Einkauf |
Itemset |
1. |
(Milch, Käse, Brot) |
2. |
(Milch, Brot, Chips) |
3. |
(Milch) |
4. |
(Joghurt, Zahnpasta, Saft) |
5. |
(Käse, Brot) |
Dies ist die Einkaufsliste von 5 Kunden. Jetzt kann mittels dieser Daten der Apriori-Algorithmus
angewandt werden.
Schwellesupport = 30%
Support von 1 elementigen Itemsets |
support(Milch)=60% |
support(Käse)=40% |
support(Brot)=60% |
support(Joghurt)=20% |
support(Zahnpasta)=20% |
support(Saft)=20% |
support(Chips)=20% |
Schwellensupport |
>= 30% |
>= 30% |
>= 30% |
< 30% |
< 30% |
< 30% |
< 30% |
|
Support von 2 elementigen Itemsets |
support(Milch, Brot)=40% |
support(Käse, Brot)=40% |
support(Milch, Käse)=20% |
Schwellensupport |
>= 30% |
>= 30% |
< 30% |
|
Support von 3 elementigen Itemsets |
support(Milch, Käse, Brot)=20% |
|
- confidence(Brot --> Milch) = 66,6%
- confidence(Milch --> Brot) = 66,6%
- confidence(Brot --> Käse) = 66,6%
- confidence(Käse --> Brot) = 100%
Aus der Tabelle kann entnommen werden, dass die Itemsets(Milch, Brot und Käse, Brot) am öftesten gekauft werden.
Außerdem erkennt man die Assoziationsregel: (Käse --> Brot).