
méthodologie
Objectif du projet
L'objectif du projet Datagotchi USA est de créer un modèle prédictif qui permet de prédire l'orientation politique des électeurs et électrices aux élections américaines de 2024 en fonction de leur style de vie. Ce modèle a pour but d'estimer en pourcentage la probabilité pour un répondant de s'identifier à chacune de cinq catégories politiques, allant de « Strong Democrat » à « Strong Republican ». Il évite l'utilisation de techniques complexes comme le machine learning, pour assurer des résultats clairs, transparents et facilement interprétables.
Méthodologie
1. Collecte de données par un sondage pilote
Pour alimenter notre modèle, nous avons réalisé un sondage pilote de mai à juillet 2024 et ce, auprès d'un panel diversifié composé d’environ 2500 électeurs américains. Ce sondage comprenait plus de 70 variables, dont les résultats ont été utilisés pour entraîner un modèle prédisant les intentions de vote des répondants et répondantes. Ces variables incluent des variables sur la partisanerie, telles que l'identification à un parti et l'intention de vote. Nous avons également intégré des variables socio-économiques (ex: genre, revenu, niveau de scolarité, etc.) pour capturer des informations démographiques standard. En complément, nous avons utilisé des variables lifestyle classiques (ex: mode de transports, fréquence de différentes activités, etc.) qui ont fait leurs preuves dans les éditions précédentes de Datagotchi, ainsi que de nouvelles variables lifestyle spécifiques aux États-Unis, élaborées à partir de séances de brainstorming. Enfin, nous avons inclus d'autres variables d’attitudes politiques pour enrichir notre modèle et mieux comprendre les orientations politiques des répondants et répondants.
[Insérer le graphique sur la VD initiale]
2. Sélection des variables
Ces variables ont ensuite été affinées et réduites à environ 30, intégrées dans la version finale de l'application. Parmi elles, certaines provenaient des éditions précédentes, tandis que des éléments spécifiques au contexte américain ont été ajoutés. La sélection des variables, validées par le sondage pilote et intégrées à l'application, s'est appuyée sur trois critères principaux : leur pertinence et intérêt pour les utilisateurs et utilisatrices, leur capacité à refléter les clivages politiques, et leur efficacité démontrée lors des éditions précédentes de Datagotchi. Ces critères nous ont permis non seulement d'améliorer la précision des prédictions des intentions de vote des participants et participantes, mais aussi d'offrir une expérience plus fluide et engageante au sein de l'application.
[Insérer graphique sur les coefficients bayésiens)
3. Développement et test des modèles
Après plusieurs tests et ajustements, nous avons finalement opté pour une configuration à deux modèles dans l'application Datagotchi, optimisés pour prédire l'orientation politique des répondants. Le premier modèle est conçu pour identifier ceux qui sont indécis, tandis que le second affine l'appartenance partisane des répondants en les classant parmi quatre catégories politiques (Strong Democrat, Soft Democrat, Soft Republican, Strong Republican).
Cette approche permet de mieux capturer les nuances politiques et de prédire avec précision l'appartenance partisane de chaque répondant. Le choix de ces deux modèles garantit une meilleure représentation des indécis tout en améliorant la précision des prédictions pour les autres segments de l'électorat.
[Graphique montrant les probabilités prédites par classe avec la nouvelle VD dans le setup à 2 modèles]
[Graphique montrant comment les prédicteurs contribuent de façon hétérogène au pseudo R2 des deux modèles]
4. Raffinement du modèle
Pour optimiser la performance de notre modèle, nous avons affiné les termes d'interaction entre les variables, ce qui nous a permis de mieux capturer les relations complexes entre différents facteurs influençant les choix politiques. En parallèle, nous avons testé diverses configurations de ces interactions dans un environnement de simulation rigoureusement contrôlé, où chaque ajustement était évalué pour son impact sur la précision des prédictions.
Afin de faciliter ces tests, nous avons mis en place un site sandbox, une plateforme interactive dédiée, où notre équipe de recherche peut expérimenter librement avec le modèle. Ce site permet de créer et manipuler des avatars théoriques—des profils virtuels représentant des combinaisons variées de caractéristiques démographiques, idéologiques, et comportementales. Grâce à cet outil, nous avons pu observer en détail comment les prédictions du modèle varient en fonction des différents profils et des interactions entre les variables. Cette approche nous a offert une compréhension plus profonde des dynamiques sous-jacentes aux comportements électoraux, et a conduit à un modèle final plus robuste et précis.
[graphiques montrant comment les prédictions changent d’un modèle à l’autre pour certains avatars, etc.]
5. Mise en œuvre finale
Nos deux modèles finaux, après de nombreux ajustements et tests, ont été soigneusement sélectionnés et intégrés dans l'application Datagotchi. Ces modèles permettent désormais de mieux prédire les intentions de vote en combinant des données sur le style de vie des utilisateurs et utilisatrices ainsi que leur localisation géographique, capturant ainsi les spécificités régionales susceptibles d'influencer les choix politiques. En croisant ces informations, l'application fournit une prédiction détaillée et personnalisée de l'orientation politique de chaque répondant et répondante.
Communiquer avec nous
Pour toute question concernant la méthodologie, veuillez nous écrire à info@datagotchi.com.
