· 

Élection américaine : Pourquoi Joe Biden a gagné – par Olivier Berruyer

Plan du billet :

 

  1. Modélisation statistique
  2. Analyse des sondages

 

I. Résultats de la Présidentielle 2020

 

En 2020, Donald Trump a obtenu l’impressionnant score de 74 millions de voix, mais Joe Biden en a obtenu 81 millions – soit 7 millions de plus. Ce résultat a entrainé la bascule de 5 États (en bleu foncé, ce sont les fameux « swing states« ) :

 

 

Rappelons qu’en 2016, c’est le système électoral américain qui avait permis à Trump de l’emporter, puisqu’il avait obtenu 63 millions de voix quand Hillary Clinton en avait obtenu 66 millions – soit 3 millions de suffrages d’écart en 2016 :

 

votes-ge-3

 

Petit rappel sur le fonctionnement des élections présidentielles aux États-Unis, qui sont une fédération d’États :

 

Le président est élu par 538 « grands électeurs« . Dans chaque État, le nombre de grands électeurs équivaut au nombre de représentants et de sénateurs de cet État au Congrès. Les grands électeurs sont désignés État par État en fonction du vote dans celui-ci.

 

L’importante particularité est que quasiment tous les États utilisent la méthode du winner-takes-all (« le vainqueur prend tout ») qui attribue 100 % des grands électeurs au candidat ayant reçu la majorité des suffrages. Ceci explique comment un candidat avec beaucoup moins de voix peut l’emporter, comme Trump en 2016 ou Bush en 2000 : il suffit que les électeurs du camp opposé soient très concentrés dans certains États.

 

 

Et c’est exactement ce qu’il s’est passé en 2020, en particulier en Californie, où Biden a obtenu 5,1 millions de voix de plus que Trump.

 

Cependant, le fait d’obtenir une telle avance, ou simplement 10 voix de plus revient exactement au même au final : les 55 grands électeurs de Californie seront tous Démocrates et voteront pour Biden.

 

En 2016, Trump n’avait été élu qu’en raison d’une très courte avance lui ayant permis de faire basculer dans son camp des États importants de la « Rust Belt » (« ceinture de rouille »), cœur industriel américain dans la région des Grands Lacs :

 

 

La « Rust Belt »

 

Il s’agissait principalement du Wisconsin, du Michigan et la Pennsylvanie, ces 3 États représentant 46 grands électeurs, soit l’exacte avance du vainqueur en 2020 comme en 2016. Cela avait été une surprise, et une vraie réussite de Trump, car cette zone autrefois prospère, mais frappée par la mondialisation, était depuis des décennies un bastion démocrate :

 

 

Résultats en 2016

 

 

Résultat aux présidentielles de puis 1992 dans ces 3 États – D = « Démocrate », R = « Républicain »

 

 

Bascule des 5 États pivots de Trump en 2016 (rond rouge) vers Biden en 2020 (flèche bleue)

 

Nous reviendrons ci-après sur les particularités des 2 derniers (Arizona et Géorgie), qui ont connu un fort changement.

 

Mais pour les 3 premiers (Michigan, Wisconsin, et Pennsylvanie), on constate qu’ils ont simplement retrouvé leur tendance historique. Et la défaite de Trump, si elle est moins importante qu’attendu, avait largement été prévue, puisque sa popularité avait fortement chuté dans ces États démocrates qu’il avait gagnés d’un cheveu en 2016.

 

Voici d’ailleurs la carte des prévisions des sondeurs publiée le 2 novembre, veille du scrutin (source) :

 

 

On constate que 4 États sur 5 ayant basculé étaient bien donnés à Biden, le 5e étant incertain.

 

Nous allons mieux comprendre dans la suite les raisons de cet échec de Trump.

 

II. Modélisation statistique

 

Afin de mieux comprendre les différences entre États, nous avons mené une analyse statistique poussée (merci à Pascal pour son aide, cette partie lui doit beaucoup).

 

2-1 Analyse bivariée

 

On s’intéresse dans un premier temps à la relation entre le score de Trump (en pourcentage) par État et 19 variables caractéristiques de la population de ces États (proportion de diplômés universitaires, origines ethniques, revenus, chômage, âge, nombre de vétérans…).

 

Sur les graphiques, chaque point représente un État (il est coloré en rouge si Trump a plus de 50 % des scrutins, en bleu sinon). L’axe vertical indique le score de Trump dans cet État et l’axe horizontal, tour à tour, différentes variables qui caractérisent la population des États.

 

S’il y a un lien entre le score de Trump et la variable considérée, la ligne noire présente une certaine pente, sinon elle reste à peu près horizontale. Si elle monte vers la droite, le facteur est favorable à Trump, si elle descend elle lui est défavorable :

 

 

Ce qui semble favoriser Trump :

 

  • pourcentage de blancs (surtout non latinos) ;
  • taux de pauvreté ;
  • pourcentage de moins de 18 ans.

 

Ce qui semble favoriser Biden :

 

  • taux de diplômés du supérieur ;
  • pourcentage d’Asiatiques, de Noirs, de Latinos ;
  • taux de personnes nées à l’étranger ;
  • revenu par habitant.

 

2-2 Analyse multivariée

 

L’étude précédente visait à analyser les liens de chacune des caractéristiques de la population des États avec le résultat de l’élection. Dans cette seconde étude, nous allons tenter de :

 

  • décrire comment interagissent ces caractéristiques ainsi que les proximités entre les États ,
  • identifier les caractéristiques des États qui expliquent statistiquement qui a gagné.

 

Nous allons utiliser une méthode statistique classique appelée l’Analyse en Composantes Principales (ACP), qui consiste à transformer des variables liées entre elles (dites « corrélées » en statistique) en nouvelles variables décorrélées les unes des autres, qui sont nommées « composantes principales », ou axes principaux. Comme c’est assez complexe, nous allons vous passer les détails et arriver aux résultats… 🙂

 

L’analyse a calculé 10 composantes principales, par valeur explicative décroissante. Voici les 4 premières pour information :

 

 

Le premier axe (F1) s’interprète par les appartenances ethniques des populations, les fortes proportions de blancs non hispaniques s’opposant à celles d’Asiatiques et de Latinos. Le deuxième axe F2 oppose les fortes proportions de diplômés et de revenus élevés aux fortes proportions de jeunes de moins de 18 ans.

 

Si on représente les États sur ce plan F1/F2, on obtient ceci :

 

 

L’intérêt de cette analyse est de constater que les États remportés par les deux principaux candidats se distinguent assez nettement.

 

L’ellipse qui englobe les États remportés par Trump est assez ramassée et essentiellement localisée dans le quart en haut et à gauche du graphique. Il est notable que pas un seul des États remportés par Biden ne se trouve dans ce quart qui est caractérisé par des populations aux revenus faibles, peu diplômées, essentiellement blanches non latinos et plutôt jeunes.

 

2-3 Modélisation

 

Pour terminer, nous allons développer un modèle simple visant à prédire le pourcentage des scrutins de Trump en fonction des variables les plus explicatives.

 

On enlève dans un premier temps les variables trop fortement corrélées entre elles :

 

 

Coefficients de corrélation entre les variables retenues

 

Un premier essai basé sur les caractéristiques de la population a cependant donné des résultats imparfaits, et nous a conduits à rajouter une variable importante : les dépenses de campagne dans chaque État, qui sont très prédictives du résultat.

 

Au final, on crée alors un modèle parcimonieux ne comprenant plus que 4 variables : les dépenses électorales, le pourcentage de diplômés, le pourcentage de blancs non latinos et la proportion de jeunes de moins de 18 ans (qui n’a donc pas d’influence directe sur le vote, mais est donc très bien corrélé à d’autres facteurs explicatifs du vote). Chacune de ses variables est très fortement prédictive du vote :

 

 

On peut interpréter ainsi ce tableau :

 

  • le pourcentage des dépenses de campagne réalisées par les Républicains (variable pc_rep_expenses) est associé à un coefficient de 0,327. Le signe est positif, donc plus les Républicains ont dépensé dans un État, plus le score de Trump a été important. On peut même quantifier cet effet : quand le pourcentage de dépenses des Républicains augmente de 1 %, le score de Trump augmente de 0,.327 % ;
  • le pourcentage de diplômés du supérieur (variable bachelors) est associé à un coefficient de -0.514. Le signe est négatif, donc plus il y a de diplômés dans un État, plus le score de Trump est faible. Quand le taux de diplômés augmente de 1 %, le score de Trump baisse de 0.514 %. Etc.

 

Précisons que, pour estimer les résultats de 50 États, il ne faut pas trop de variables, sinon, cela fausse l’estimation. Ainsi, il suffirait de prendre 50 variables au hasard (taille moyenne, proportion de hérissons, consommation de chocolat…) pour avoir un modèle qui prédirait parfaitement le résultat en 2020. Mais bien sûr, il donnerait des prévisions totalement fausses en 2024 par exemple, et n’aurait donc aucun intérêt.

 

Le nôtre est robuste, et prédit donc assez bien le résultat de Trump en 2020 dans chaque État, comme on l’observe ici :

 

 

On a représenté en vert les 5 États ayant basculé en 2020

 

La différence entre la prédiction et la réalité est nommée « résidu », et voici donc le graphique de tous les résidus :

 

 

Dans la partie supérieure figurent les États où Trump a obtenu un peu plus que ce que prévoit le modèle, et en bas un peu moins.

 

 

En fait, comme nous le verrons, la variable qui explique les plus gros écarts est très probablement le taux de participation par origine ethnique, mais hélas cette donnée n’est pas encore disponible.

 

En conclusion, cette étude ne démontre aucune aberration flagrante dans les résultats électoraux par État – les 5 swing states ne se différenciant guère d’autres États.

 

On note également qu’un facteur prédictif majeur du vote Trump est la proportion de personnes blanches non hispaniques. Ce fait permet de comprendre son échec :

 

1/ cette catégorie diminue élection après élection dans le corps électoral, et donc le résultat de Trump était naturellement tiré par le bas par ce phénomène (source) :

 

 

2/ Trump avait été élu avec une très faible marge en 2016

 

3/ Trump n’a non seulement pas eu de réussites lui ayant permis de bénéficier de forts taux de popularité dans la population pour contrebalancer l’effet démographique, mais en outre, il a été plombé par la crise du Covid (source) :

 

 

Comparaison des popularités de Trump et Obama au même stade de leur premier mandat

 

La défaite de Trump était donc inéluctable.

 

III. Analyse des sondages

 

Pour terminer cette analyse, nous vous proposons une analyse très fouillée des sondages réalisés au moment du vote, pour en comprendre les facteurs.

 

3-1 Résultats globaux

 

Voici une présentation des 9 dernières élections présidentielles américaines :

 

 

On observe que le score de Trump en 2020 est dans une honorable moyenne des dernières élections, tout comme Biden – qui est loin du score d’Obama en 2008.

 

Si on s’intéresse à l’avance des Démocrates en pourcentage des voix, on obtient ceci :

 

 

Depuis les années 1990, l’avance des voix des Démocrates est très fréquente. Il semble cependant qu’il faille qu’elle soit supérieure à 2,5 – 3,5 % pour entrainer la victoire au niveau des Grands Électeurs.

 

Entre 2016 et 2020, on note que l’avance des Démocrates a augmenté de +2,3 points.

 

On note également que la raison principale de la victoire de Trump en 2016 était surtout la contre-performance d’Hillary Clinton. On pourrait dire que Trump a gagné car Clinton a perdu – et non pas l’inverse…

 

3-2 Raisons du vote

 

La question suivante est très intéressante ; elle concerne l’adhésion au candidat pour lequel les électeurs ont voté :

 

 

On note que Trump disposait d’un soutien personnel auprès de ses électeurs nettement plus important que Biden.

 

Au niveau de l’influence des questions politiques, on observe ceci :

 

 

Les Démocrates ont voté principalement sur le critère des inégalités raciales et du Covid, et ceux de Trump surtout sur l’économie.

 

3-3 Influence du Sexe

 

Voici le vote par Sexe en 2020 :

 

 

Si Biden était le candidat des femmes, Trump était celui des hommes…

 

Un recul montre que c’est une situation fréquente. Voici l’historique du vote masculin :

 

 

Et ici celui du vote féminin :

 

 

Pour plus de clarté, voici l’historique de l’avance démocrate par sexe :

 

 

On note d’ailleurs qu’Hillary Clinton a obtenu en 2016 un score très classique chez les femmes, mais une sévère contre-performance chez les hommes.

 

Voici enfin la bascule des scores de l’avance démocrate entre 2016 et 2020 par sexe :

 

 

En 2020, les femmes ont voté un tout petit peu plus Républicain (+ 1 point), mais les hommes ont beaucoup plus voté Démocrate (+ 6 points). On note que, en pondérant par le poids de chaque sexe, on retrouve alors bien la différence de + 2,3 points.

 

Nous allons par la suite effectuer les mêmes analyses sur d’autres critères. Afin d’en alléger la lecture, les résultats détaillés sont masqués, et affichés seulement si vous cliquez sur les boutons dédiés.

 

3-4 Influence de l’origine ethnique

 

Ce critère est fondamental dans l’élection américaine. Voici le résultat global en 2020 :

 

 

Si 55 % des Blancs ont voté Républicain, seuls 8 % des Noirs l’ont fait, 35 % des Latinos et 39 % des autres origines ethniques.

 

Afficher la suite : historique détaillé par origine

 

Voici la synthèse de l’avance des Démocrates

 

 

Trump a donc réalisé une contre-performance chez les Blancs en 2020. On note aussi, sans surprise, l’effet Obama chez les Noirs en 2008 et 2012.

 

 

On observe en revanche un phénomène qui semble se développer : les latinos votent de moins en moins fortement démocrate.

 

On a donc en synthèse pour 2020 par rapport à en 2016 :

 

 

La raison majeure de la bascule de 2020 est que les Blancs ont nettement moins voté Républicain qu’à l’accoutumée, et les Noirs un peu plus.

 

Ce dernier point est plus important qu’il n’y parait, car il a probablement contribué à faire basculer au moins un des swing states de 2020, la Géorgie :

 

 

Les deux sièges de sénateur de Géorgie ayant basculé des Républicains aux Démocrates, ils ont également entrainé la perte de la majorité républicaine au Sénat.

 

Or ceci est dû à l’action de Stacey Abrams, figure du Parti démocrate en Géorgie, soutenue par Bernie Sanders. En 2013, la Cour suprême a vidé de sa substance une partie du Voting Rights Act de 1965, qui interdisait les discriminations raciales dans l’exercice du droit de vote. Ceci a par exemple entrainé la fermeture de près de 10 % des bureaux de vote de Géorgie, affectant les électeurs noirs de manière disproportionnée. Stacey Abrams a joué un rôle clé en aidant à inscrire plus de 800 000 nouveaux électeurs en Géorgie, faisant basculer cet État. (source)

 

 

C’est le genre d’action qui explique certains résidus de notre précédente modélisation.

 

3-5 Influence du sexe et de l’origine ethnique

 

On peut dès lors cumuler les deux critères précédents. On obtient ceci pour 2020 :

 

 

Afficher la suite : historique détaillé par sexe et origine

 

Et voici en conclusion les différences 2016/2020 :

 

 

On retrouve bien ainsi nos conclusions précédentes.

 

On peut enfin réaliser le graphique de synthèse suivant, en pondérant ces résultats par le poids de chaque catégorie, afin de retrouver l’évolution de +2,3 % du vote démocrate :

 

 

On peut d’ailleurs faire le même exercice entre la forte victoire d’Obama en 2008 et celle de Biden en 2020 :

 

 

L’écart s’explique en bonne partie par le fait que l’électorat noir et latino a moins soutenu Biden.

 

3-6 Influence de l’âge

 

Intéressons-nous maintenant au vote par âge. Voici le résultat global en 2020 :

 

 

On observe clairement que Biden est le candidat des moins de 50 ans, et Trump celui des plus de 50 ans.

 

Afficher la suite : historique détaillé par sexe et origine

 

Par rapport à 2016, on observe que Biden a été porté par les moins de 24 ans et les quadragénaires, mais que Trump a amélioré son score chez les 25-39 ans.

 

 

3-7 Influence de l’âge et de l’origine ethnique

 

Si on cumule les deux critères pour plus de finesse, on obtient ceci pour 2020 :

 

 

Afficher la suite : historique détaillé par âge et origine

 

Au final, on observe une bascule républicaine impressionnante chez les minorités de 30 à 45 ans, et chez les latinos âgés :

 

 

Voici enfin le graphique pondéré de l’évolution entre 2016 et 2020 :

 

 

qu’on peut représenter plus simplement ainsi :

 

 

3-8 Influence de l’éducation

 

Intéressons-nous maintenant au vote par niveau éducatif. Voici le résultat global en 2020 :

 

 

On observe une claire stratification par âge : plus on est diplômé, plus on vote démocrate.

 

Afficher la suite : historique détaillé par niveau éducatif

 

Voici la synthèse :

 

 

On observe que si Biden a fortement progressé sur les personnes à formation Bac+1 à Bac +5, Trump a amélioré son score chez les personnes les plus diplômées.

 

3-9 Influence de l’éducation, du sexe et de l’origine

 

Si on cumule le niveau éducatif avec le sexe et l’origine ethnique, on obtient ceci en 2020 :

 

 

On observe que c’est bien l’origine ethnique qui influence majoritairement le vote.

 

Afficher la suite : historique détaillé multicritères

 

Ces graphiques de synthèse sont très importants.

 

 

 

On y mesure bien la perte par Trump des hommes blancs non diplômés, donc des classes laborieuses qui ont un poids très important dans la « Rust Belt« , et qui expliquent la bascule de ces 3 swing states, et donc la défaite de Trump. Il saute aux yeux que beaucoup de démocrates blancs ouvriers avaient cru à Trump en 2016, avant de revenir en 2020 à leurs habitudes électorales, comme on le voit dans ce graphique :

 

 

En fait, on pourrait dire que la « normalité », c’est que Trump perde, et « l’exception », c’est sa victoire, comme en 2016, qu’il n’a pas réédité.

 

3-10 Influence du niveau de revenus

 

Intéressons-nous maintenant au vote par niveau de revenus – fortement corrélé au niveau éducatif. Voici le résultat global en 2020 :

 

 

 

On a souvent lu que Trump était le candidat préféré des personnes gagnant plus de 100 000 $ par an, ce qui est vrai.

 

Mais on voit tout l’intérêt de mieux segmenter, car ils sont à égalité chez les plus de 200 k$, et Biden est probablement majoritaire chez les millionnaires.

 

L’évolution récente est d’ailleurs très intéressante :

 

 

Les très pauvres votent de plus en plus Républicain, et les très riches de moins en moins Républicain…

 

Afficher la suite : historique détaillé par niveau de revenus

 

Voici l’influence dans l’élection 2020 :

 

 

On observe une très forte bascule des classes moyennes vers Biden, mais une bascule contraire des classes supérieures vers Trump – qu’il a probablement définitivement perdues le 6 janvier.

 

C’est particulièrement visible sur cette analyse par comté (l’équivalent de nos départements) :

 

 

 

Les comtés gagnés par Biden représentent 70 % du PIB contre 30 % pour Trump.

 

Ce qui donne ceci au niveau des évolutions entre 2016 et 2020, ainsi qu’entre 2008 et 2020 :

 

 

 

3-11 Influence de l’orientation sexuelle

 

Intéressons-nous maintenant au vote par orientation sexuelle. On obtient ceci en 2020 :

 

 

On constate que les LGBT votent deux fois plus Démocrate que Républicain.

 

Afficher la suite : historique détaillé par orientation sexuelle

 

 

 

On observe cependant que chez le LGBT, le score de Trump en 2020 est néanmoins le double de celui de 2016.

 

3-12 Influence de la religion

 

Intéressons-nous maintenant au vote par religion, vu son importance dans ce pays. Voici le résultat global en 2020 :

 

 

On observe que les personnes religieuses votent majoritairement Républicain, et les athées Démocrate.

 

Afficher la suite : historique détaillé par religion

 

Voici l’évolution 2020/2016 :

 

 

En 2020, Biden a pu être élu car il a été plus soutenu par les athées et les catholiques, qui ont contrebalancé un soutien plus appuyé de Trump par les autres chrétiens.

 

 

3-13 Influence de la zone de résidence

 

Intéressons-nous pour conclure au vote par zone de résidence. Voici le résultat global en 2020 :

 

 

On observe que Biden est le candidat des zones urbaines, et Trump celui des zones rurales.

 

Afficher la suite : historique détaillé par type de zone de résidence

 

On obtient finalement l’évolution suivante entre 2016 et 2020 :

 

 

 

En conclusion, il apparait clairement que Trump a principalement perdu la présidentielle en raison de pertes importantes au niveau des classes moyennes et des classes laborieuses blanches.

 

Edit : un petit complément vu les commentaires rapportant le story telling de Trump sur les fraudes.

 

1/ Rappelons qu’aucune fraude sérieuse n’a été rapportée dans la cinquantaine de procédures lancées par Trump. Aucun juge n’ayant suivi, cela a constitué cinquante échecs.

 

2/ rappelons qu’il est quasi impossible de réaliser une fraude d’ampleur par correspondance. En effet, pour ce faire :

 

A/ il faudrait choisir le nom des abstentionnistes à la place de qui voter. Comment est-il possible de savoir en avance qu’une personne ne votera pas le jour du vote ?
B/ rappelons en outre que dans beaucoup d’États, les listes électorales sont purgées tous les 4 ou 8 ans. Il y a donc peu d’inscrits ne votant pas (c’est pourquoi la participation ne s’y exprime pas comme chez nous en fonction des inscrits, mais de la population en âge de voter. Sinon il y aurait toujours 90 ou 95 % de participation) ;
C/ ensuite, un détail, il faut imiter la signature de l’abstentionniste qui a été miraculeusement détecté en amont, puisqu’elle est évidemment contrôlée ;
D/ et pas de chance, dans beaucoup d’États, on peut regarder par Internet si on a voté ou non – donc il faut en plus être sûr que l’abstentionniste ne vérifie pas que le fraudeur a voté pour lui…
E/ le tout avec un échec de près de 0 %, car si 10 ou 15 abstentionnistes se plaignent que leur vote a été contrefait, la supercherie sera immédiatement détectée, et ne pourra qu’entrainer une vérification approfondie des votes…
F/ donc bonne chance au fraudeur. Car c’est un coup à passer le reste de sa vie en prison. Pour information, une citoyenne qui a voté illégalement (donc un seul vote faux dans l’élection) a été condamnée à… 8 ans de prison (source). Et aux USA, les peines se cumulent à chaque infraction.

 

Cela fait un siècle que des procédures ont été mises en place et développées pour contrer ce genre de fraude…

Source: Les Crises

 

Écrire commentaire

Commentaires: 0