K-nearest neighbour Insgesamt geht es um die Klassifikation von Daten Hier im Beispiel gibt es 2 Features und k=3
Problem:
Rechner weiß nicht, welcher Datenpunkt am nächsten liegt.
Umsetzung
- Bestimmung der Entfernung (Vektorgeometrie)
- geg.:
- Abstand zwischen 2 Punkten
- || =
- || = ()
- Bestimmung für alle Datenpunkte
- Sortieren der Entfernung und bestimmen der k-nächsten Nachbarn
- Zu welcher Klasse gehören die k-nächsten Nachbarn
- Welche Klasse ist am meisten vertreten?
- Datenpunkt gehört auch zu dieser Klasse
