Referat

Ausarbeitung

Präsentation

Valid HTML 4.01 Transitional

Clusteranalyse:



k-Means:

Die Clusteranalyse kann mittels Algorithmus k-Means gemacht werden. k steht für die Anzahl der Gruppen. Dabei werden zuerst alle
Objekte (hier Kunden) in ein Koordinatensystem mit n-Achsen eingetragen, wobei n die Anzahl der verschiedenen Produkte, die gekauft wurden, ist.


Beispiel k = 2, n = 2 Danach werden zufällig k-Objekte als Start Schwerpunkte ausgewählt.
Phase1 Phase2
Hierauf werden die einzelnen Objekte dem nähesten
Schwerpunkt zugeordnet.
Anschließend wird in jeder Gruppe ein neuer Schwerpunkt erstellt,
der gleich weit von jedem Punkt in der Gruppe entfernt ist.
Phase3 Phase4
Nun werden die Objekte erneut dem nahesten Schwerpunkt
zugeordnet.
phase5

Falls ein Objekt nun zu einem anderen Schwerpunkt gehört als vorher,
wird erneut ein Schwerpunkt in der neuen Gruppe ermittelt und wieder getestet.


Problem:

Je nach Wahl der Startpunkte für die Schwerpunkte können sich unterschiedliche Ergebnisse ergeben.

Um möglichst gute Zuordnungen zu den Clustern zu erhalten, werden mehrere Durchläufe
mit unterschiedlichen Startpunkten für die Schwerpunkte durchgeführt.