Actualités

Sondages sur les intentions de vote de la population en âge de voter en Haïti: Une lecture technique et politique

 

sondage poll touthaiti

Si en général les sondages ont toujours existé en Haïti, les enquêtes sur les intentions de vote sont cependant trois fois plus jeunes que nos 30 années de boiteuses expériences démocratiques débutant avec la chute de la dictature duvaliériste. De 1957 à 1986, sonder les intentions de vote en Haïti était impossible dans la mesure où le régime d’alors était une monocratie de type autocratique. Avant 1957, les suffrages universels n’existaient pas. L’occupation Américaine qui mettait une fin aux régimes pronunciamientos, n’a institué ni un suffrage universel, ni renforcé les pratiques de « suffrage parlementaire » jalonnant tout le 19ème siècle. C’est, en effet, un conseil d’état qui remplaçait le parlement durant toute l’occupation. Quoiqu’une forme de suffrage universel fut adoptée dans la constitution de 1935 (art. 38), elle s’est vitement dissipée dans les amendements de 1939 (art. 39). Après la chute d’Elie Lescot, Dumarsais Estimé, l’un des instigateurs de la charte de 1935 créant une « monarchie présidentielle absolue »[1], fut élu par un parlement au prix des subterfuges et des manœuvres anticonstitutionnelles les plus inimaginables. Et enfin, l’accouchement aux forceps du suffrage universel de 1957, consacrant la victoire du docteur François Duvalier avec 69% des votes, allait mourir asphyxié dans la dictature. Ainsi, l’environnement politique qui prévalait en Haïti était historiquement incompatible à toutes tentatives d’estimer les intentions de vote de la population.

 Depuis tantôt 10 ans, une firme haïtienne dénommée bureau de recherche en informatique et en développement économique et social (Brides) a initié la pratique de sonder les intentions de vote de la population pendant les périodes électorales. Les résultats de ces sondages sont toujours contestés par certains acteurs politiques mettant en doute la crédibilité morale même de l’institution. D’un autre coté, d’autres utilisent ces sondages comme leur référence la plus scientifique pour inciter les indécis et ceux qui ont de l’aversion pour les perdants à supporter et voter leurs estimés gagnants. Mais rarement, pour ne pas dire jamais, une critique est produite sur la méthodologie qui accouche ces résultats qui vont être soit rejetés d’un revers de main par certains, soit acceptés aveuglément par d’autres. C’est évidemment dans la perspective de pallier à ce déficit que cet article est rédigé.

Pourquoi un sondage ?

D’abord, un sondage est une technique permettant d’utiliser un sous-ensemble, un échantillon, tiré d’un ensemble appelé population afin de généraliser sur le comportement de la population. En d’autres termes, un sondage permet d’inférer les paramètres d’une population (m, s, p) à partir des caractéristiques d’un échantillon appelées statistiques (x-bar, s, p).   Les sondages sont réalisés parce qu’en général ils sont moins couteux, et dans certains cas, recenser toute une population est pratiquement impossible. Cependant, si l’objectif principal du sondage est de faire des inférences à partir d’un échantillon à une population, la précision et la validité de cette inférence ne résident que dans la représentativité de l’échantillon choisi. Un échantillon est représentatif d’une population, lorsque son choix est basé sur les postulats de la théorie des probabilités. En dehors de ces théories, particulièrement le théorème central limite de LaPlace, les statistiques provenant de l’échantillon ne peuvent pas être utilisées pour estimer les paramètres de la population. En fait, on distingue deux principaux types d’échantillons probabilistes (les restes étant des combinaisons de ces deux méthodes) : 1) un échantillon issu d’un tirage aléatoire simple où il y a une équiprobabilité pour chaque membre de la population d’être sélectionné, et 2) un échantillon d’un tirage aléatoire systématique où seulement la première unité est tirée aléatoirement et ensuite les autres sont choisies à un intervalle prédéterminé. D’autres modes d’échantillonnages, comme les méthodes à plusieurs phases et plusieurs degrés, peuvent combiner le tirage simple, le tirage systématique et la stratification. Dans le cas des sondages du Brides, on verra que la technique utilisée est une combinaison de méthodes appelée méthode à deux degrés, mais qui pourtant n’offre aucune information en ce qui attrait au mode de tirage utilisé pour sélectionner les unités á chaque étape.

Il est important de noter que la représentativité d’un échantillon ne dépend pas forcément de sa taille. Certains croient que plus la taille d’un échantillon est grande, plus l’échantillon est représentatif. Toutes choses étant égales par ailleurs, certainement un échantillon de taille 100 est plus représentatif qu’un échantillon de taille 30. Cependant, un échantillon de taille d’un million où les individus ne sont pas choisis aléatoirement avec une probabilité connue (non nulle) est moins représentatif qu’un échantillon de 500 individus choisis aléatoirement. Ce, pour dire que ce qui importe vraiment dans le choix de la taille c’est le facteur aléatoire. Statistiquement, pour les sondages estimant les proportions comme les intentions de vote, la taille de l’échantillon est fonction de deux principaux facteurs : 1) le seuil de confiance, le critère adopté (généralement 95%) quant à la certitude sur la validité des résultats[2], et 2) la marge d’erreur souhaitée. Ceci permet de clarifier une question fondamentale pour des amis qui, après la publication des résultats du Brides, m’ont appelé pour me dire qu’il y a une autre enquête d’un échantillon de plus grande taille qui donne des résultats différents. La taille d’échantillonnage de la dernière enquête du Brides est 11900, cela ne veut pas dire que ses résultats seront plus fiables qu’un sondage qui se porterait sur un échantillon de 1000 si les principes des probabilités ne sont pas respectés dans la méthodologie du Brides. Egalement, une autre enquête sur un échantillon d’une taille supérieure à celui du Brides ne serait pas plus crédible pour les mêmes raisons mentionnées.

On ne peut pas non plus obtenir un échantillon représentatif d’une population si cette dernière n’est pas organisée d’une façon à faciliter une bonne sélection des unités d’échantillonnages. En d’autres termes, la base d’échantillonnage (ou base de sondage), la liste comportant tous les éléments de la population, doit être clairement définie pour que la représentativité de l’échantillon ne laisse pas beaucoup à désirer. Pour être plus concret, en Haïti, la base d’échantillonnage est composée de 11967 sections d’énumération (SDE) et chaque SDE comprend en moyenne 200 ménages. La base de sondage dans laquelle le Brides sélectionne son échantillon pour ses deux dernières enquêtes est-elle à jour ? Pour saisir l’importance de cette question se portant sur la qualité de la base d’échantillonnage, imaginer une situation où un échantillon d’étudiants est sélectionné dans une liste comportant tous les étudiants d’une université donnée afin d’obtenir les intentions de vote, si la majorité des étudiants choisis ne peuvent pas être interviewés parce qu’ils ont abandonné ou sont déjà gradués, et si ceux qui ont abandonné ont un profil typé différent des autres répondant à l’enquête, les résultats de ce sondage reflèteront difficilement les opinions de la population estudiantine de cette université. Si la base de sondage était à jour, elle ne comporterait pas les étudiants abandonnés et déjà gradués.

La question sur la qualité de la base de sondage du Brides est importante quand on sait que les SDE ont été délimités depuis 2001, dans le cadre du recensement de la population de l’IHIS. Par exemple, pour l’enquête sur l’emploi et l’économie informelle (EEEI) réalisée par l’IHSI dont la collecte des données s’est déroulée entre octobre et novembre 2007, la base de sondage retenue est l’Echantillon-Maitre d’Enquêtes Multiples auprès des Ménages (EMEM-I) révisé à partir des données cartographiques de 2002[3]. Tandis que pour l’enquête sur les conditions de vie des ménages après le séisme (ECVMAS) en 2012, l’IHSI a dû effectuer des travaux cartographiques préparatoires pour mettre à jour la base de sondage surement affectée par le séisme de 2010. Dans le rapport de sondage du Brides, la question de l’actualisation de la base de sondage n’est mentionnée nulle part. Il est important de savoir si le Brides s’est servi des récents travaux de l’IHSI dans le cadre du ECVMAS 2012.

Il faut tout au moins souligner qu’une analyse de la méthodologie des deux dernières enquêtes du Brides est une tâche non moins difficile dans la mesure où sur environ 180 pages (la première 176 pages, la deuxième 134 pages), la méthodologie est présentée en moins de quatre paragraphes occupant seulement une page. La méthodologie fait un survol non saisissable du mode de sélection de l’échantillon. D’après le rapport, « Le choix de ces personnes a été réalisé selon un tirage à deux degrés dont le premier a été la sélection des grappes de ménages ou sections d’énumération (SDE) et au deuxième degré les ménages ont été choisis au sein des SDE à raison de 25 par SDE »[4]. Ceci ne permet pas de comprendre comment d’abord les SDE sont sélectionnées : est-ce un tirage aléatoire simple, où chaque SDE a la même probabilité d’être choisie ? Ou un tirage aléatoire systématique, où seulement la première SDE est tirée au hasard et les autres selon un intervalle prédéterminé? Ensuite, quel type de tirage permettant de choisir les ménages à l’intérieur des SDE ? Ces questions sont sans réponses dans la méthodologie. Ce qui est, peut-être, clair c’est qu’après avoir sélectionné les ménages, le Brides utilise une grille, dénommée grille de Kish, pour sélectionner un individu aléatoirement au sein du ménage. Une telle méthode a l’avantage de permettre à l’enquêteur d’éviter de choisir dans les ménages la personne manifestant le plus grand intérêt à répondre à l’enquête. Cependant, l’inconvénient de cette méthode c’est qu’elle requiert à l’agent enquêteur de demander l’âge des personnes faisant partie du ménage pour faire la sélection. Etant donné qu’une telle demande est souvent perçue comme une intrusion, elle peut causer une résistance à la collaboration. En outre, on se demande pourquoi un échantillon de 11900 ménages aboutit à 11997 interviewés (voir le deuxième tableau, p. 5-6) ? D’où viennent ces 97 personnes ? Est-ce possible que dans certains ménages deux individus sont sélectionnés ? Si oui, n’est-ce pas une violation de la méthode de Kish ?  

Généralement, les gens collaborent difficilement aux enquêtes se portant sur leurs intentions de vote. Ajoutant à cela, demander à quelqu’un son âge constitue une plus grande entrave à sa collaboration, ce qui augmenterait le taux de non-réponse. Dans le cas du Brides, l’effectif des indécis et de non réponse pour la présidence s’élève à 1589 individus représentant un total de 13.2%. Cela ne doit pas passer comme une lettre à la poste quand on sait que les indécis et ceux qui refusent de répondre pourraient avoir un profil typé. Et s’ils sont différents de ceux qui collaborent, la fiabilité des résultats est questionnable. Particulièrement, il serait intéressant de savoir la constitution du taux de non réponse dans le sondage du Brides. Les non réponses peuvent résulter du refus du ménage, dans lequel cas c’est la personne qui ouvre la porte qui refuse que l’agent ait accès au ménage. Elles peuvent aussi être dues au refus de la personne sélectionnée où c’est la personne même qui refuse de répondre. En dernier lieu, les non réponses peuvent être causées par une absence prolongée de la personne choisie. Dans tous ces cas, si les personnes refusant de répondre, ou impossible d’être rejointes, ont des opinions différentes des autres acceptant de répondre ou rejointes, le biais de non réponse entravera l’inférence statistique en ce sens qu’on ne peut pas conclure que ce qui est observé dans l’échantillon est le reflet de la population.

Tout ceci pour dire que l’enquête du Brides doit être analysée au peigne fin vu que la méthodologie offre peu de possibilités de juger de la fiabilité de ses résultats. Dans un prochain article, je montrerai comment les résultats définitifs d’une élection peuvent correspondre aux résultats d’un sondage ne respectant même pas les règles de probabilités, donc un faux sondage. J’analyserai dans ce cas la politique des sondages politiques. Je montrerai que les indécis et ceux qui ont de l’aversion pour les perdants ont tendance à voter le candidat à la tête des sondages. Les groupes d’intérêts économiques, animés du souci de faire des profits, ont également tendance à investir là où la probabilité de gagner parait plus certaine. Donc, souvent quand les résultats des élections coïncident avec les résultats d’une enquête, cela ne constitue pas une indication d’un bon sondage. Tout aussi vrai est qu’une élection affichant des résultats différents d’un sondage n’est pas une preuve que les estimations de l’enquête étaient biaisées, car les acteurs peuvent développer des stratégies pour faire mentir l’enquête. Ce serait de la bonne guerre. Cependant, quand il est permis à des institutions de publier des résultats d’un sondage deux semaines (ou moins) avant le jour des élections, il est pratiquement impossible de faire mentir les enquêtes. C’est pourquoi, certaines démocraties choisissent de régulariser les enquêtes sur les intentions de vote.

Claude Joseph
Adjunct professor of Statistics and Research methods
Fordham University and Lehman College

Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.


[1] Moise Claude, Constitutions et luttes de pouvoir en Haïti: La solution Américaine 1915-1946, tome II. Editions de l’Université d’Etat d’Haïti.

[2] Si on prend plusieurs échantillons d’une même population, 95 fois sur 100, cet échantillon constituera une fidèle représentation de la population.

[3] IHSI, Enquêtes sur l’emploi et l’économie informelle, Juillet 2010

[4] Sondages du Brides du 5 au 11 octobre 2015, p. 3

Les Dernieres Nouvelles