Thierry Foucart prolonge et approfondit une réflexion déjà engagée dans les colonnes de Mezetulle1 sur l’usage peu rigoureux des probabilités et de la statistique dans le domaine des sciences sociales. Il examine ici, en l’illustrant avec quelques études de cas, l’hypothèse bien connue « toutes choses égales par ailleurs », souvent utilisée pour détecter l’existence de discriminations.
De nombreux travaux en sciences sociales souffrent d’un déficit de scientificité dans l’application des mathématiques appliquées. On ne compte pas les enquêtes qui font « comme si » les données étaient tirées au hasard en effectuant un calcul de probabilité, « comme si » l’échantillon était représentatif en étendant ses propriétés à l’ensemble de la population, « comme si » les résultats étaient indiscutables, etc. L’hypothèse « toutes choses égales par ailleurs » est un des exemples les plus fréquents de ce genre d’abus : on fait « comme si » elle était vraie, parce qu’elle facilite considérablement la détection de la « cause » d’une discrimination. Mais elle limite cette cause au facteur qui crée l’inégalité.
Hypothèse « toutes choses égales par ailleurs »
Imaginons à titre d’exemple une étude sociologique dont l’objectif est de décrire les relations existant entre le sexe, la catégorie socioprofessionnelle, l’âge, le revenu, le secteur d’activité et l’opinion politique des électeurs en France. Pour étudier l’influence d’un de ces facteurs sur un autre, par exemple de la catégorie socioprofessionnelle sur l’opinion politique, ou du sexe sur le revenu, l’hypothèse « toutes choses égales par ailleurs » (notée TCEA dans la suite) consiste à isoler la relation entre les deux facteurs considérés en excluant l’influence de tous les autres. L’objectif est de mettre en évidence ce que l’on appelle l’ »effet propre » d’un facteur sur l’autre, ici de la CSP sur l’opinion politique ou du sexe sur le revenu.
Pour connaître l’effet propre de la catégorie socioprofessionnelle (CSP) sur l’opinion politique, qui dépend peut-être aussi de l’âge, il faut annuler l’effet de ce dernier pour observer uniquement celui de la CSP. Il faudrait théoriquement procéder de la même façon pour tous les facteurs intervenant dans l’opinion politique, non seulement les facteurs cités précédemment (sexe, revenu, âge, secteur d’activité), mais aussi le niveau de diplôme, la catégorie socioprofessionnelle des parents, l’ancienneté dans l’entreprise, la mobilité, le lieu d’habitation, la situation familiale, etc., en fait tous les facteurs susceptibles d’avoir un effet sur l’opinion politique. La liste des facteurs à inclure dans l’hypothèse TCEA ne peut être établie que par le chercheur et dépend inévitablement de son choix, de son appréciation a priori de l’effet que chaque facteur exerce sur l’opinion politique.
La rationalité de cette liste doit toujours être vérifiée. Elle peut comporter une aporie. Par exemple, dans la comparaison des revenus suivant le sexe, l’hypothèse TCEA ne peut inclure l’égalité des revenus des conjoints, bien que le revenu de l’un exerce évidemment un effet sur celui de l’autre. Supposer leur égalité pour montrer que les revenus des hommes sont supérieurs à ceux des femmes TCEA est contradictoire puisque leurs conjoints sont de sexes différents. D’autres apories, qui n’apparaissent pas toujours aussi clairement, peuvent exister.
Démarche initiale théorique
Respecter l’hypothèse TCEA conduit à des difficultés insurmontables et impose des approximations.
La première difficulté résulte de la nécessité de coder l’information indispensable au traitement statistique. Cette codification a pour objectif de définir des catégories dont les membres possèdent à peu près les mêmes caractéristiques, et de constituer ainsi des groupes homogènes. Une codification de plus en plus fine limite les variations à l’intérieur de chaque groupe, en rassemblant des individus de plus en plus ressemblants, mais elle aboutit à augmenter le nombre de groupes homogènes considérés et à diminuer l’effectif moyen des groupes. Une information de plus en plus fine est de moins en moins statistiquement stable.
Donnons un exemple : l’âge exerce un effet sur l’opinion politique qui empêche d’isoler celui de la CSP. Pour écarter cette influence, on va considérer les personnes du même âge. Cette condition ne peut être réalisée qu’en considérant des classes d’âge, de vingt à trente ans, de trente à quarante, etc. Dans chacune d’entre elles, l’âge moyen, ou central, est considéré comme l’âge de tous ses membres : c’est l’approximation évoquée ci-dessus. Si les classes sont d’amplitude de cinq ans, c’est plus précis, mais l’effectif dans chaque classe est plus faible et les résultats sont moins stables.
Une autre difficulté est l’impossibilité de suivre rigoureusement la démarche de l’hypothèse TCEA.
Pour que l’on puisse éliminer aussi le sexe de cette relation, il faut trier les individus en fonction à la fois de leur âge (4 classes) et de leur sexe (2 sexes). On obtient en tout huit groupes, chacun étant constitué de personnes de même classe d’âge et de même sexe. L’hypothèse TCEA, limitée au sexe et à l’âge, est à peu près vérifiée dans chaque classe. On peut alors étudier la relation entre l’opinion politique et la CSP dans chaque groupe dans lequel l’hypothèse TCEA réduite au sexe et à l’âge est satisfaite.
Et ainsi de suite pour tous les facteurs retenus dans l’hypothèse TCEA. Considérons 4 classes d’âge, 4 classes de revenus, 4 secteurs d’activité et le sexe : il faut répartir l’échantillon des personnes observées en 128 ( = 4 x 4 x 4 x 2) groupes homogènes, dans chacun desquels on peut supposer que leurs membres ont le même “profil” : même âge, même sexe, même revenu, même secteur d’activité approximativement.
Il faudrait ensuite analyser la liaison entre la CSP et l’opinion politique dans chacun de ces 128 groupes pour détecter dans chaque groupe l’effet propre de la CSP sur l’opinion politique et en déduire, si possible, un effet général.
Le nombre de groupes homogènes augmente très vite avec le nombre de facteurs inclus dans l’hypothèse TCEA. Imaginons que l’on tienne compte, en plus des quatre facteurs précédents, du nombre d’enfants (de 0 à 3 ou plus), du revenu du conjoint (4 classes), du secteur d’activité (4 secteurs) : le nombre de groupes considérés est alors de 128 x 4 x 4 x 4, soit 8 192. Même en tenant compte des groupes vides, il est impossible de disposer d’un échantillon de taille suffisante pour que l’analyse statistique dans chaque groupe homogène ait un sens. On ne pourra mettre en évidence une relation que dans ceux d’entre eux qui ont un effectif suffisant, ce qui réduit le champ de l’analyse.
La modélisation
La statistique propose d’aborder l’analyse d’une façon différente, en représentant par des équations les relations entre les facteurs. Elle fournit alors des résultats apparemment plus faciles à interpréter, sur des données d’un effectif relativement limité, souvent de l’ordre de quelques milliers.
Une méthode classique est la régression linéaire multiple. Elle consiste à construire un modèle donnant la meilleure approximation possible d’un facteur appelé endogène (ou expliqué, ou dépendant) en fonction d’autres facteurs exogènes (ou explicatifs ou indépendants). Un exemple sur des données élémentaires est facile à interpréter :
On suppose que la régression linéaire multiple du poids en fonction de la taille, de l’âge et du sexe donne l’équation suivante :
Poids = 0.30 x Taille + 0.40 x Âge +2.0 x Sexe + 5
Dans cette équation, les coefficients de la taille, de l’âge et du sexe sont appelés coefficients de régression. Les résidus sont les différences entre les valeurs observées et les valeurs prédites : ils indiquent la précision de l’estimation.
Cette formule est évidemment approximative. Elle donne un ordre de grandeur des poids des individus observés (poids prédits dans le tableau ci-dessus) en fonction de leurs caractéristiques et les différences avec leurs poids observés (résidus). Plus précisément, c’est l’estimation du poids moyen des individus dont la taille, l’âge sont connus, que l’on peut calculer pour un homme et pour une femme : à âge et taille égaux, une femme pèse en moyenne 2kg de moins qu’un homme :
On détecte ainsi l’effet propre du sexe sur le poids à taille et âge égaux.
Critique de la modélisation
Ce modèle suppose a priori l’existence d’un effet propre de chaque facteur exogène sur le facteur endogène : lorsque la taille augmente de 10 cm, le poids augmente de 3 kg, et lorsque l’âge augmente de 10 ans, de 4 kg, sous l’hypothèse TCEA. La nature des facteurs justifie ce choix, les facteurs exogènes étant ceux sur lesquels on ne peut intervenir. Cette existence a priori est indissociable de la modélisation, et l’hypothèse mathématique implicite est la linéarité de la relation entre le facteur endogène et chaque facteur exogène, par exemple entre le poids et la taille. De même, les relations entre les facteurs exogènes sont supposées linéaires (le calcul utilise les coefficients de corrélation linéaire pour évaluer les relations entre les facteurs). Ces relations sont évidemment approximatives.
Les calculs étant toujours possibles, la vérification de ces hypothèses est nécessaire pour que le modèle représente de façon acceptable les données. Elle peut être effectuée par des tests statistiques ou, plus simplement, par des représentations graphiques mais est très souvent négligée.
Les valeurs calculées des coefficients de régression ne sont jamais nulles. Pour montrer l’existence d’un effet propre d’un facteur exogène, il faut contrôler que son coefficient de régression est significativement non nul, à l’aide d’un test statistique. Une hypothèse mathématique supplémentaire est alors nécessaire : les résidus doivent être répartis suivant la loi normale.
Ces hypothèses, théoriques, ne peuvent être prouvées avec certitude, mais le modèle linéaire est « robuste », c’est-à-dire que les résultats restent significatifs si elles sont simplement vraisemblables. Un grand nombre d’hypothèses réduit la vraisemblance de l’ensemble, ce qui limite le nombre de facteurs exogènes. On retrouve ici le principe de parcimonie (ou rasoir d’Ockham).
L’application du modèle à la population dont sont issues les données suppose idéalement que ces données soient tirées au hasard, a minima qu’elles constituent un échantillon représentatif de la population. C’est un modèle descriptif, et les prévisions du facteur endogène par des intervalles de confiance sont en général très imprécises.
La modélisation consiste en fait à résoudre les difficultés de la démarche initiale en émettant des hypothèses sur la nature des données. Les informations qu’elle donne ne sont jamais « objectives » : les choix du chercheur conditionnent les résultats qui ne sont que descriptifs.
Études de cas
Les exemples ci-dessous montrent la limite de ce type de démarche.
The Bell curve
Richard J. Herrnstein et Charles Murray (1994), se fondant sur des analyses statistiques nombreuses et relativement complexes comme des régressions linéaires multiples et des analyses factorielles effectuées sur un grand nombre d’observations, interprètent les résultats de leurs enquêtes sur la réussite sociale aux États-Unis comme la preuve scientifique de l’infériorité de certaines races humaines sur d’autres : les Américains d’origine africaine réussissent moins bien socialement que ceux d’origine européenne qui réussissent eux-mêmes moins bien que ceux d’origine asiatique « toutes choses égales par ailleurs ». Les auteurs en déduisent l’existence d’une hiérarchie raciale.
La contestation scientifique de ce travail ne peut être effectuée que par des spécialistes de ces analyses. Stephen J. Gould (1997), en montrant les limites épistémologiques des méthodes utilisées par Murray et Herrnstein, contredit totalement leur raisonnement et les accuse de racisme.
Mais on peut aussi supposer que les enquêtes sont correctes et leurs résultats numériques exacts. La critique consiste alors à raisonner en logique floue (Foucart, 2024). Les deux auteurs de The Bell curve n’ont pas comparé la vraisemblance de leur conclusion (l’existence d’une hiérarchie raciale) à celle de leurs hypothèses statistiques et de l’hypothèse TCEA. Si toutes les hypothèses statistiques sont contrôlées et les tests justifiés, accepter l’hypothèse TCEA revient à accepter l’existence d’une hiérarchie raciale. Refuser cette existence revient donc à refuser cette hypothèse : cela signifierait que des facteurs de la réussite sociale aux États-Unis n’ont pas été pris en compte dans cette hypothèse. C’est beaucoup plus vraisemblable. Lesquels ? Il appartient aux sociologues de les déterminer en examinant précisément l’hypothèse TCEA.
Les sciences de l’éducation
Les sciences de l’éducation foisonnent d’enquêtes fondées sur l’hypothèse TCEA. Un exemple est donné par Thierry Troncin (2005) dans sa thèse en sciences de l’éducation. Il veut mesurer l’effet du redoublement du cours préparatoire à l’école primaire. Pour cela, il considère des binômes d’élèves de CP dont l’un redouble et l’autre non, mais dont les résultats en cours préparatoire sont à peu près les mêmes et les parents de même niveau social.
On compare ensuite les résultats en CE1 des élèves de chaque binôme. Le constat est clair : ceux qui n’ont pas redoublé le CP ont de meilleurs résultats en CE1 que ceux qui l’ont redoublé. Cela peut être interprété de deux façons :
- La réussite en CE1 de l’élève non redoublant du binôme montre que le redoublant aurait réussi s’il était passé sans redoubler dans la classe supérieure : le redoublement ne sert à rien. Cette interprétation est fondée sur l’acceptation de l’hypothèse TCEA dans chaque binôme.
- La sélection des élèves qui sont passés dans la classe supérieure a été correctement faite, ce qui montre l’insuffisance de l’hypothèse TCEA : un facteur significatif de la réussite des élèves ne figure pas dans les profils de l’hypothèse TCEA.
L’hypothèse de l’égalité des élèves d’un même binôme est-elle plus vraisemblable qu’une insuffisance dans l’hypothèse « toutes choses égales par ailleurs » ? Il est évident que la réponse est négative. L’hypothèse TCEA est ici très contestable. Par exemple, l’absence du QI dans cette hypothèse revient à considérer qu’il n’intervient pas dans la réussite d’un élève, l’éducation parentale peut être très différente au sein d’une même CSP, les parents peuvent être mariés ou célibataires, etc. La précaution prise par Troncin, qui précise systématiquement les limites de l’hypothèse (« toutes choses égales par ailleurs incluses dans le modèle », « autant que faire se peut »), est complètement justifiée, et réduit considérablement l’intérêt de l’étude quantitative.
Dans beaucoup d’autres enquêtes concernant la réussite scolaire cette hypothèse est simplement formulée et admise sans réserve. Certains auteurs expliquent par exemple que le redoublement ne sert à rien puisqu’il ne permet pas de rattraper le retard du redoublant : c’est un raisonnement curieux, qui suppose l’égalité des capacités a priori des élèves et que les causes des difficultés d’un élève en CP disparaissent après le redoublement. La condamnation du redoublement est souvent sans appel, avec des argumentations parfois inacceptables, consistant à reprocher aux enseignants de faire redoubler plus fréquemment les élèves de milieu modeste que les autres (Martine Laronche, 2004). La seule justification du redoublement est l’intérêt de l’élève perçu par les enseignants et les parents, et la seule justification de son interdiction systématique semble être l’intérêt financier du ministère de l’Éducation nationale.
Détection des discriminations
Les résultats d’une étude (Adida C. Laitin D., Valfort M.-A., 2010) menée suivant la méthode précédente « soulignent donc une réalité dérangeante : dans la République française théoriquement laïque, les citoyens musulmans issus de l’immigration rencontrent, toutes choses égales par ailleurs, des obstacles à l’intégration par l’accès à l’emploi bien plus élevés que leurs homologues chrétiens. »
La laïcité n’a rien à voir avec cette discrimination. L’hypothèse TCEA est ici définie par la similitude complète des CV envoyés en double, l’un sous un nom courant, l’autre sous un nom musulman : même âge, même diplôme, même expérience professionnelle, etc. Cette hypothèse revient à considérer que les CV contiennent tous les critères de recrutement utiles aux employeurs, ce qui est évidemment très contestable : ils sont nécessaires, mais pas suffisants. Elle ne tient pas compte de leur expérience, de leur volonté de limiter le risque dans le choix du candidat, des exigences des salariés, de leur protection sociale.
La démarche des employeurs est en quelque sorte « bayésienne », comme celle des policiers accusés de discrimination dans les contrôles d’identité (François Héran, 2010) : « Par rapport aux passants perçus comme « blancs » et selon les lieux observés, la probabilité d’être contrôlé est de 4 à 11 fois plus forte si l’on est perçu comme « noir », de 3 à 13 fois plus si l’on est perçu comme “arabe” […] . Interrogé sur la chaîne France 2, un porte-parole de la Police nationale [… ] a fait valoir que les objectifs de la police étaient d’aller au plus court : il n’y avait pas de sens à contrôler à l’identique les deux sexes, dans toutes les tranches d’âge et tous les milieux, sachant que les risques d’infraction étaient inégalement répartis. C’est un raisonnement typiquement bayésien (le choix du probable doit être guidé par les probabilités passées) ». Les chefs d’entreprise sont confrontés à la même difficulté.
Conséquence : description et prescription
Considérer comme « vraie » l’hypothèse TCEA limite l’explication d’une inégalité au critère considéré pour l’observer. La conséquence est l’interprétation systématique de toute inégalité comme une injustice sociale dont la cause ne peut être que la différence entre les individus des deux membres de l’inégalité : les hommes ont un revenu supérieur à celui des femmes parce que ce sont des hommes. Une autre cause contredirait l’hypothèse TCEA et invaliderait l’analyse.
L’objectif d’égalité réelle ayant remplacé l’égalité en droits dans la Constitution, les conditions d’application du théorème Hume sont vérifiées (Boudon, 2006, p.85) : le résultat descriptif (l’inégalité observée) est complété par un argument normatif (l’objectif d’égalité réelle). Les deux justifient une prescription (impérative) annulant l’inégalité pour rétablir l’égalité : le politique vote des lois pour rétablir l’égalité réelle : lois sur la parité sexuelle, interdisant les discriminations. « Elles s’en prennent aux effets, non aux causes. Or ce sont les causes qu’il faut atteindre, ne serait-ce que pour bien comprendre les effets » (Durkheim, 1928, p. 10). C’est une démarche politique simpliste et scientifiquement infondée.
Références
- Adida Claire, Laitin David, Valfort Marie-Anne, 2010, « Identifying Barriers to Muslim Integration in France », Proceedings of the National Academy of Sciences, 107(52), 384-390. Url : https://www.pnas.org/content/107/52/22384
- Boudon Raymond, 2006, Renouveler la démocratie, Odile Jacob, Paris.
- Dixte Christophe, Loussouarn Christophe, 2024, « « Revenu des médecins libéraux : une légère hausse entre 2017 et 2021, avec de fortes disparités selon la spécialité et l’ancienneté d’installation », Études et Résultats, décembre 2024 • n° 1322, DREES.
- Durkheim Émile, 1928, Le socialisme, Librairie Félix Alcan, Paris. Url : https://gallica.bnf.fr/ark:/12148/bpt6k1197227d.texteImage#
- Foucart Thierry, 2024, « Probabilités et statistique appliquées aux sciences sociales et humaines » Url : https://www.mezetulle.fr
- Gould Stephen J., 1997, La mal-mesure de l’homme, Odile Jacob, Paris.
- Héran François, 2010, Inégalités et discriminations – Pour un usage critique et responsable de l’outil statistique : rapport du comité pour la mesure de la diversité et l’évaluation des discriminations, COMEDD. Url : https://www.vie-publique.fr/rapport/30934-inegalites-et-discriminations-usage-critique-et-responsable-statistiques
- Herrnstein Richard J., Murray Charles, 1994, The Bell curve, The Free Press, New York.
- Laronche Martine., 2004, « Redoublement : les études s’opposent aux pratiques des enseignants », Le Monde, 11 décembre 2004.
- Tocqueville Alexis, 1835, De la démocratie en Amérique, tome II, Garnier Flammarion Paris, 1981.
- Troncin Thierry., 2005, « Le Redoublement, radiographie d’une décision à la recherche de sa légitimité », Thèse en Sciences de l’Éducation, sous la direction de Jean-Jacques Paul, Université de Bourgogne.
1 – Voir notamment « Probabilités et statistique appliquées aux sciences sociales et humaines » https://www.mezetulle.fr/probabilites-et-statistique-appliquees-aux-sciences-sociales-et-humaines-par-thierry-foucart/