K-nearest neighbour Insgesamt geht es um die Klassifikation von Daten Hier im Beispiel gibt es 2 Features und k=3

. Problem: Rechner weiß nicht, welcher Datenpunkt am nächsten liegt.

Umsetzung

  1. Bestimmung der Entfernung (Vektorgeometrie)
    • geg.:
    • Abstand zwischen 2 Punkten
      • || =
      • || = ()
  2. Bestimmung für alle Datenpunkte
  3. Sortieren der Entfernung und bestimmen der k-nächsten Nachbarn
  4. Zu welcher Klasse gehören die k-nächsten Nachbarn
  5. Welche Klasse ist am meisten vertreten?
    • Datenpunkt gehört auch zu dieser Klasse