Qu'est-ce que KNN?
K-Nearest Neighbors (KNN) est un algorithme de classification base sur une idee simple:
"Dis-moi qui sont tes voisins, je te dirai qui tu es"
Fonctionnement:
- Pour un nouveau point, trouver les k points les plus proches
- Regarder les classes de ces k voisins
- Predire la classe majoritaire
Exemple: Si k=5 et les 5 voisins sont [A, A, B, A, B], on predit A (3 contre 2).
Avantages:
- Tres intuitif et facile a comprendre
- Pas d'entrainement (lazy learning)
- Fonctionne pour classification et regression
- Pas d'hypothese sur la distribution des donnees
Inconvenients:
- Lent en prediction (doit calculer toutes les distances)
- Sensible a l'echelle des features
- Sensible au "fleau de la dimension"
- Le choix de k est important