Construction du graphe
Le graphe relie des personnalités à des préjugés (tropes). Chaque lien provient d'un propos documenté, sourcé et archivé dans notre veille.
Un même propos peut mobiliser plusieurs préjugés. Dans ce cas, il génère autant de liens dans le graphe. C'est pourquoi le nombre de connexions est supérieur au nombre de propos documentés.
Exemple
Un propos de X qualifié à la fois de complot juif mondial (P2) et de double loyauté (P5) crée deux connexions dans le graphe : X → P2 et X → P5.
Structure bipartite
Le graphe est bipartite : les nœuds sont de deux types (personnalités et tropes) et les liens ne relient que des nœuds de types différents. Cette structure permet de projeter le graphe en réseau de co-citation : deux personnalités sont proches si elles mobilisent les mêmes préjugés.
Pondération
Le poids d'un lien correspond au nombre de propos documentés associant une personnalité à un préjugé donné. Un lien de poids 5 signifie que nous avons documenté cinq propos distincts reliant cette personnalité à ce trope.
Détection de communautés
Les communautés (clusters) sont des groupes de nœuds plus densément connectés entre eux qu'avec le reste du graphe. Nous utilisons l'algorithme de Louvain (Blondel et al., 2008), une méthode standard en analyse de réseau.
Louvain en bref
L'algorithme optimise la modularité : une mesure qui compare la densité de liens à l'intérieur de chaque communauté par rapport à ce qu'on attendrait au hasard. Plus la modularité est élevée, plus les communautés sont distinctes.
Interprétation
- Modularité > 0.3 : structure communautaire significative
- Modularité > 0.5 : communautés bien séparées
- Modularité > 0.7 : très forte structure communautaire
Pourquoi les clusters révèlent des convergences
Quand des personnalités d'orientations politiques opposées se retrouvent dans le même cluster, cela signifie qu'elles mobilisent les mêmes préjugés — un indicateur de convergence discursive parfois qualifiée de confusionnisme.
Métriques calculées
Propagateurs (HITS)
L'algorithme HITS (Kleinberg, 1999) identifie les personnalités qui citent le plus de préjugés différents et occupent une position centrale dans le réseau.
Convergences (co-signatures)
Personnalités d'orientations politiques opposées qui citent les mêmes préjugés. Un signal de convergence transversale.
Polarisation
Matrice de distance entre orientations politiques, calculée à partir des préjugés partagés. Mesure la spécialisation discursive de chaque famille.
Chambres d'écho
Communautés où les liens internes sont significativement plus nombreux que les liens externes — un indice d'enfermement discursif.
Protocole de validation
Chaque calcul est soumis à trois tests de robustesse avant publication.
1. Bootstrap (stabilité)
Nous ré-échantillonnons le graphe 100 fois en retirant aléatoirement 10 % des liens à chaque itération. Si les communautés détectées restent stables (> 75 % de cohérence), le résultat est considéré fiable.
2. Multi-algorithmes (reproductibilité)
Nous comparons les résultats de Louvain et de Leiden (Traag et al., 2019), deux algorithmes indépendants. La cohérence est mesurée par l'Adjusted Mutual Information (AMI). Un AMI > 0.7 indique un accord solide.
3. Modularité (qualité)
La modularité du partitionnement doit dépasser 0.3 pour que les communautés soient considérées comme significatives (et non comme un artefact statistique).
Transparence
Les scores de validation sont affichés en temps réel sur la page Analyses. Si un indicateur est en dessous du seuil, un avertissement est affiché.
Limites
- Le graphe ne reflète que les propos que nous avons documentés, pas l'ensemble des discours antisémites. Il est par construction partiel.
- La stabilité du bootstrap augmente mécaniquement avec la taille du corpus. Sur un petit corpus, une stabilité de 60-70 % est attendue et n'invalide pas les résultats.
- Les communautés détectées sont des regroupements statistiques, pas des « alliances » intentionnelles.
Références
- Blondel, V. D., Guillaume, J.-L., Lambiotte, R. & Lefebvre, E. (2008). « Fast unfolding of communities in large networks ». Journal of Statistical Mechanics.
- Kleinberg, J. M. (1999). « Authoritative sources in a hyperlinked environment ». Journal of the ACM.
- Traag, V. A., Waltman, L. & van Eck, N. J. (2019). « From Louvain to Leiden: guaranteeing well-connected communities ». Scientific Reports.
- Lancichinetti, A. & Fortunato, S. (2012). « Consensus clustering in complex networks ». Scientific Reports.