Faut-il croire les sondages?

Depuis plusieurs semaines, les journaux titrent « Bayrou en baisse ». Pourtant, la situation est plus nuancée, il serait plus juste de titre « Bayrou ne monte plus », ou « Bayrou résiste aux tirs croisés du PS et de l’UMP ». S’il baissait réellement depuis trois semaines, il serait à 15%, pas entre 17 et 22% ! D’ailleurs, certains sondages le donnent en baisse, mais d’autres en hausse. Si l’on entre ensuite dans les détails, on trouve des informations étonnantes et contradictoires.

Le Canard Enchaîné du 28 mars a révélé qu’en résultats bruts, Bayrou devance Ségolène Royal dans tous les sondages. Il est ensuite pondéré, mais les sondeurs ont des difficultés à trouver des coefficients faute de données antérieures, car le Bayrou de 2002 n’est plus le Bayrou de 2007, et que les résultats de l’UDF aux régionales ou aux européennes sont différents de ceux d’une présidentielle. Mêmes difficultés, mais moindres, pour pondérer Royal et Sarkozy, dans une élection où la personnalité joue un rôle au moins aussi important que l’appartenance à un parti.

En conclusion: si les sondages ne mentent pas, ils sont incapables de nous prédire le résultat. En attendant les surprises du 22 avril…
Mais que signifient vraiment les sondages ? Nul doute qu’ils indiquent assez justement la tendance, mais ils sont impuissants à nous donner le classement final si les écarts sont très reserrés. Ils portent environ sur 1000 personnes, avec des biais liés à l’heure, à l’utilisation de téléphones fixes, à la surreprésentation des grandes villes, etc.

S’ils étaient complètement aléatoires, si les personnes interrogées étaient sincères, l’intervalle de confiance à 95% pour 1000 personnes serait de [f-1/√1000; f+1/√1000] où f est la fréquence observée. Cela signifie que le résultat qui est donné peut être à majorer de 3,16% ou à minorer de 3,16%.

Mais les méthodes utilisées en France ne sont pas aléatoires. Elles travaillent selon la méthode des quotas et appliquent des coefficients de correction selon les candidats, en fonction de leurs résultats précédents. On peut débattre pour savoir si ces techniques sont plus ou moins fiables que l’alea, dans tous les cas, les fourchettes proposées sont de 4 à 6%, ce qui ne permet pas de savoir qui arrivera en tête. C’est d’autant plus vrai que les opinions vont encore changer dans les semaines qui viennent et qu’il y a toujours beaucoup d’indécis.

Reprenons les chiffres de 2002 par exemple: le dernier sondage BVA, effectué le vendredi 19 avril, donnait Chirac à 19%, Jospin à 18% et Le Pen à 14%. Le 21 avril au soir, le résultat de l’élection était à la surprise générale Chirac 19,88%, Le Pen 16,86%, Jospin 16,18%.

Même en supposant que les opinions n’ont pas varié entre le vendredi et le dimanche et que les réponses étaient sincères, si l’échantillon de 1000 personnes était aléatoire, le sondage disait vrai. En effet, les chiffres de BVA devaient être lus, en tenant compte de l’intervalle de confiance à 95% et de la taille de l’échantillon: Jacques Chirac entre 15, 8 % et 22,2 %, Lionel Jospin entre 14,8 % et 21,2 %, Jean-Marie Le Pen entre 10,8 % et 17,2 %. Philippe Dutarte, professeur de mathématiques, propose une simulation de ce sondage aléatoire ici.

Sur un autre site, ce professeur explique la méthode des quotas:

En France, à la différence semble-t-il des Etats-Unis, la méthode des sondages aléatoires est peu utilisée et les instituts ont souvent recours, pour leurs enquêtes d’opinion, à la méthode des quotas. Dans cette méthode, on exploite la structure connue de la population (par exemple grâce au recensement) pour reproduire la même structure dans l’échantillon. On choisit pour cela certains caractères de la population, que l’on pense devoir être en rapport avec l’enquête menée, comme le sexe, l’âge, la catégorie socioprofessionnelle, le type de commune… Ces caractères sont nommés variables de contrôle. Si l’on connaît la distribution de la population selon ces variables de contrôle, on obtient ainsi des quotas qui devront être respectés par les enquêteurs.

« Avec la méthode des quotas, il n’existe pas de loi mathématique permettant de déterminer la marge d’erreur d’un sondage », explique Jean-François Doridot, directeur du département opinion d’Ipsos, « en pratique toutefois, on considère que la marge d’erreur des sondages par quotas est égale, voire inférieure à celle des sondages aléatoires. » Des études ont cependant montré que cette méthode avait tendance à sous-représenter les travailleurs de l’industrie, les personnes les moins instruites ou ayant peu d’activités sociales… On peut douter de l’affirmation précédente selon laquelle la marge d’erreur par la méthode des quotas est égale « voire inférieure » à celle des sondages aléatoires. Le hasard est encore, pour éviter les biais, le meilleur allié du statisticien.

De plus, des difficultés spécifiques aux sondages politiques (ou aux enquêtes d’opinion) tiennent non plus aux problèmes de biais affectant la constitution de l’échantillon, mais aux réponses des sondés : abstentionnistes répugnant à avouer qu’ils n’ont pas l’intention de voter, indécision jusqu’au dernier moment, sympathisants d’extrême droite hésitant à afficher leurs opinions… A la lumière des élections précédentes, des coefficients rectificatifs sont alors appliqués, faisant ainsi du sondage politique davantage un art alchimique qu’une science.

Pour « redresser » les résultats bruts des sondages effectués lors de la campagne présidentielle de 2002, on a pratiqué les « pondérations » suivantes. Lionel Jospin, lorsqu’il recueille 26 à 27% en données brutes, est crédité de 22% après pondération, de même Jacques Chirac passerait de 30% en brut à 27% en pondéré, ou Jean-Marie Le Pen de 4% à 8% en pondéré (chiffres cités par Philippe Méchet de la Sofres). Ces pondérations sont établies à partir de plusieurs élections antérieures et de questions posées par le sondeur et permettant de mesurer le « degré de certitude » du choix de l’électeur.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.