SOLUTION DETAILLEE
Prenez le temps de comparer avec vos reponses. Verifiez chaque etape !
RAPPEL DES DONNEES
Points : A(1,2), B(2,1), C(2,3), D(8,7), E(9,8), F(8,9)
Centroides initiaux : $\textcolor{#9B7AC4}{C_1 = (1, 1)}$, $\textcolor{#F7E64D}{C_2 = (9, 9)}$
PARTIE 1 : Calcul des distances
$$d(A, C_1) = \sqrt{(1-1)^2 + (2-1)^2} = \sqrt{0 + 1} = \textcolor{#27ae60}{\mathbf{1.00}}$$
$$d(A, C_2) = \sqrt{(1-9)^2 + (2-9)^2} = \sqrt{64 + 49} = \textcolor{#e74c3c}{\mathbf{10.63}}$$
$$d(D, C_1) = \sqrt{(8-1)^2 + (7-1)^2} = \sqrt{49 + 36} = \textcolor{#e74c3c}{\mathbf{9.22}}$$
$$d(D, C_2) = \sqrt{(8-9)^2 + (7-9)^2} = \sqrt{1 + 4} = \textcolor{#27ae60}{\mathbf{2.24}}$$
| Point | Coords | Distance a C1 | Distance a C2 | Plus proche |
|---|
| A | (1, 2) | 1.00 | 10.63 | C1 |
| B | (2, 1) | 1.00 | 10.63 | C1 |
| C | (2, 3) | 2.24 | 9.22 | C1 |
| D | (8, 7) | 9.22 | 2.24 | C2 |
| E | (9, 8) | 10.63 | 1.41 | C2 |
| F | (8, 9) | 10.63 | 1.00 | C2 |
PARTIE 2 : Assignation aux clusters
2.1) Point A : $d(A, C_1) = 1.00 < d(A, C_2) = 10.63$ → $\textcolor{#9B7AC4}{\text{Cluster 1}}$
2.2) Point D : $d(D, C_1) = 9.22 > d(D, C_2) = 2.24$ → $\textcolor{#F7E64D}{\text{Cluster 2}}$
- $\textcolor{#9B7AC4}{\text{Cluster 1}}$ : A, B, C (les 3 points en bas a gauche)
- $\textcolor{#F7E64D}{\text{Cluster 2}}$ : D, E, F (les 3 points en haut a droite)
$\boxed{\text{Cluster 1} = \{A, B, C\} \quad \text{Cluster 2} = \{D, E, F\}}$
PARTIE 3 : Mise a jour des centroides
Points du Cluster 1 : A(1,2), B(2,1), C(2,3)
$$C_1' = \left( \frac{1+2+2}{3}, \frac{2+1+3}{3} \right) = \left( \frac{5}{3}, \frac{6}{3} \right)$$
$\boxed{C_1' = \textcolor{#9B7AC4}{(1.67, 2.00)}}$
Points du Cluster 2 : D(8,7), E(9,8), F(8,9)
$$C_2' = \left( \frac{8+9+8}{3}, \frac{7+8+9}{3} \right) = \left( \frac{25}{3}, \frac{24}{3} \right)$$
$\boxed{C_2' = \textcolor{#F7E64D}{(8.33, 8.00)}}$
- $C_1$ : $(1, 1) \to (1.67, 2.00)$ → deplacement de $\sqrt{0.67^2 + 1^2} = 1.20$
- $C_2$ : $(9, 9) \to (8.33, 8.00)$ → deplacement de $\sqrt{0.67^2 + 1^2} = 1.20$
Les centroides se sont deplaces vers le "centre de gravite" de leurs points.
PARTIE 4 : Calcul de l'inertie
$$\text{Inertie}_{init} = d(A,C_1)^2 + d(B,C_1)^2 + d(C,C_1)^2 + d(D,C_2)^2 + d(E,C_2)^2 + d(F,C_2)^2$$
$$= 1^2 + 1^2 + 2.24^2 + 2.24^2 + 1.41^2 + 1^2$$
$$= 1 + 1 + 5 + 5 + 2 + 1 = \textcolor{#e67e22}{\mathbf{15}}$$
- $d(A, C_1') = \sqrt{(1-1.67)^2 + (2-2)^2} = 0.67$
- $d(B, C_1') = \sqrt{(2-1.67)^2 + (1-2)^2} = 1.05$
- $d(C, C_1') = \sqrt{(2-1.67)^2 + (3-2)^2} = 1.05$
- $d(D, C_2') = \sqrt{(8-8.33)^2 + (7-8)^2} = 1.05$
- $d(E, C_2') = \sqrt{(9-8.33)^2 + (8-8)^2} = 0.67$
- $d(F, C_2') = \sqrt{(8-8.33)^2 + (9-8)^2} = 1.05$
$$\text{Inertie}_{new} = 0.67^2 + 1.05^2 + 1.05^2 + 1.05^2 + 0.67^2 + 1.05^2$$
$$= 0.45 + 1.10 + 1.10 + 1.10 + 0.45 + 1.10 = \textcolor{#27ae60}{\mathbf{5.30}}$$
$\boxed{\text{Inertie} : 15 \to 5.30 \text{ (reduction de 65\%)}}$
L'inertie a diminue car les centroides sont maintenant au centre de leurs clusters, minimisant les distances.
PARTIE 5 : Interpretation
- Recalculer les distances avec $C_1'$ et $C_2'$
- Verifier si les assignations changent
- Si aucun point ne change de cluster → convergence
Avec $C_1 = (5, 5)$ et $C_2 = (5, 6)$, les deux centroides sont proches. L'algorithme pourrait :
- Converger vers une solution differente
- Ou trouver la meme solution apres plus d'iterations
K-Means minimise l'inertie localement, pas globalement. Differentes initialisations peuvent mener a differents minima locaux. C'est pourquoi n_init=10 execute 10 fois avec des initialisations differentes et garde le meilleur resultat.
RESUME DES RESULTATS
| Etape | Cluster 1 | Cluster 2 | Inertie |
|---|
| Initial | C1 = (1, 1) | C2 = (9, 9) | 15.0 |
| Apres 1 iter | C1' = (1.67, 2) | C2' = (8.33, 8) | 5.3 |
- $\textcolor{#9B7AC4}{Violet}$ : Cluster 1 et son centroide
- $\textcolor{#F7E64D}{Jaune}$ : Cluster 2 et son centroide
- $\textcolor{#27ae60}{Vert}$ : Distance gagnante (plus proche)
- $\textcolor{#e74c3c}{Rouge}$ : Distance perdante (plus loin)
- $\textcolor{#e67e22}{Orange}$ : Inertie initiale