Aus dem Kurs: Python für die Datenanalyse 2: Machine Learning

Erhalten Sie Zugriff auf diesen Kurs – mit einer kostenlosen Probeversion

Werden Sie noch heute Mitglied und erhalten Sie Zugriff auf mehr als 25.300 Kurse von Branchenfachleuten.

Bewertung des Modells

Bewertung des Modells

Ich habe hier aufbauend auf einem Datensatz mit Autodaten ein Dendrogramm erzeugt, um hierarchisches Clustering vornehmen zu können. Und wenn wir dabei beachten, dass wir hier zwei Linien sehen, dann haben wir bei der Annahme, dass wir maximale Entfernung zwischen zwei Nachbarn 500 haben wollen, zwei Cluster. Das sehen Sie daran, dass es hier zwei Schnittpunkte gibt mit dieser Linie bei 500. Damit wollen wir jetzt Cluster erzeugen und das passiert hier in diesem Code. Ich habe eine Variable k=2, also, zwei Cluster und dann instanziiere ich eine Klasse, die hier oben importiert wurde aus sklearn.cluster, Agglomerative Clustering. Und die bekommt hier einige Parameter, von denen die Anzahl der Cluster natürlich sehr interessant ist, n_clusters, aber auch affinity und linkage. Das ist die Maßeinheit für die Entfernung, die wir benutzen wollen, das euklidische. Und wir haben die Verbindung mit Ward hier übergeben. Wir werden noch andere Kombinationen im Ramen dieses Beispiels austesten…

Inhalt