Discrimination statistique.pdf Discrimination statistique.pdf
Size : 189.998 Kb
Type : pdf

 La discrimination statistique entre pertinence et arbitraire


1. Introduction

La question de l’évaluation morale des discriminations est beaucoup plus complexe qu’on pourrait le penser de prime abord. Les pratiques discriminatoires se présentent en effet sous des formes multiples, procèdent de sources diverses et visent à satisfaire des préférences hétéroclites. La prise en compte de cette hétérogénéité s’avère nécessaire si l’on veut identifier les propriétés qui expliquent et justifient le caractère moralement répréhensible des pratiques discriminatoires. Négliger cette complexité, c’est au contraire courir le risque de tenir pour essentielles à la description et à l’évaluation de la discrimination des propriétés qui ne le sont pas; c’est surtout s’exposer à l’écueil de ne pas reconnaître certaines des formes les plus insidieuses de discrimination ou se priver de la capacité d’expliquer en quoi elles sont moralement problématiques.

Les formes les plus manifestes de discrimination sont assurément, dans ce qu’elles ont de plus arbitraire, le reflet et la traduction comportementale d’une animosité ou d’une préoccupation morale différenciée envers certaines catégories de personnes. Nous avons tendance à en déduire que l’hostilité et l’arbitraire constituent des propriétés essentielles à l’identification des pratiques discriminatoires et à la condamnation morale qui y est associée. L’intérêt du modèle de la discrimination statistique vient notamment de ce qu’il nous invite à questionner la validité de ces intuitions. Je m’intéresserai ici à la question de savoir si la discrimination statistique, en raison du caractère pertinent des considérations sur lesquelles elle s’appuie, constitue véritablement une forme non arbitraire de discrimination. Avant d’aborder ce point, je commencerai par présenter la notion de discrimination statistique et par montrer en quel sens elle correspond bien à une forme de discrimination à l’encontre de certains individus et de certains groupes.

2. La discrimination statistique

Le 11 mai 2006, Jack Lang, député socialiste du Pas-de-Calais, adressait une lettre au ministre de la Santé et des Solidarités, Xavier Bertrand, dans laquelle il qualifiait l’exclusion des homosexuels masculins du don du sang, en vigueur en France depuis 1983, de «mesure discriminatoire extrêmement choquante». Dans sa réponse, le ministre faisait valoir les risques de transmission du virus du sida comme raison d’être d’une telle exclusion. Dans la mesure où les techniques de dépistage, malgré l’amélioration de leur efficacité, ne permettent toujours pas d’identifier ce virus lorsque l’infection est très récente, soulignait-il, la prudence commande de prendre en considération toutes les contre-indications qui signalent un risque particulier. Or, «les données épidémiologiques montrent que la prévalence de l’infection au VIH dans la population homosexuelle masculine sexuellement active serait de 12,3% contre 0,2% dans la population générale». En outre, les comportements sexuels à risque, ou encore la probabilité d’apparition de nouveaux virus, seraient plus importants chez les personnes ayant des pratiques homosexuelles. Il en résulte, selon le ministre, que «l’homosexualité ne constitue bien évidemment pas en soi un critère d’exclusion du don du sang. […] Ce n’est […] pas le fait d’être homosexuel, mais la pratique de relations sexuelles entre hommes qui constitue une contre-indication au don du sang. D’ailleurs, l’homosexualité féminine n’est pas une contre-indication» (1).

Lors d’un discours sur la criminalité noire prononcé en 1993 à Chicago, le pasteur Jesse Jackson, militant des droits civiques, confessa : «Rien ne m’est plus douloureux à ce stade de mon existence que l’expérience qui consiste à entendre des bruits de pas alors que je suis en train de marcher dans la rue, commencer à penser à une agression, regarder autour de moi et me sentir soulagé en constatant qu’il s’agit d’un Blanc» (2). De fait, les statistiques de la criminalité aux États-Unis indiquent une surreprésentation considérable de certaines catégories de la population dans la plupart des crimes et délits. Le sexe, l’âge et la race constituent trois critères particulièrement significatifs d’un taux de criminalité plus élevé. Ainsi en 2005, 90% des auteurs de meurtre dont l’identité était connue s’avéraient être des hommes, 64 % avaient moins de 30 ans et 52,6% appartenaient à la population noire, bien que celle-ci ne représente que 12,5 % de la population totale des États-Unis (3).

Sur la base de ces données, d’innombrables jeunes hommes noirs subissent au quotidien l’humiliation d’une suspicion infondée, tant de la part des forces de police qui concentrent sur eux leur vigilance que de la part des personnes qui se conçoivent comme des victimes potentielles. Jusqu’à un certain point, pourtant, il semble possible de rendre compte de la discrimination dont ils sont victimes en des termes similaires à l’exclusion des homosexuels masculins du don du sang. De même que l’homosexualité ne constitue pas en soi un critère d’exclusion du don du sang, mais seulement en tant qu’elle est un indicateur pertinent d’un risque accru de contamination par le virus du sida, ce n’est pas l’appartenance raciale en tant que telle qui constitue ici le critère de la discrimination, mais seulement l’appartenance raciale en tant qu’elle signale effectivement un risque accru de criminalité dans certaines circonstances spécifiques. Dans les deux cas, une différence de traitement s’opère sur la base d’une caractéristique des individus utilisée comme indice de la probabilité d’une autre caractéristique.

La notion de «discrimination statistique» (4) vise à rendre compte de ce type de phénomènes. Elle fait référence à la catégorie des comportements motivés par la reconnaissance du fait qu’une caractéristique A facilement identifiable des individus composant un groupe donné est positivement mais imparfaitement corrélée avec une caractéristique B, difficilement identifiable et considérée comme préjudiciable à la réalisation d’une finalité sociale ou personnelle légitime. La discrimination statistique apparaît ainsi comme un élément d’un problème de filtrage survenant dans une situation d’incertitude et d’information imparfaite au sujet des qualités individuelles des personnes avec lesquelles un agent entre en relation. Ce dernier préfèrerait différencier les individus sur la base de la caractéristique B qui l’intéresse réellement. Toutefois, en raison des difficultés ou des coûts liés à son identification, il utilise la caractéristique A comme un substitut ou un indice se suppléant à l’objet distant inconnaissable ou difficile d’accès B, même si cela le conduit à traiter, injustement dans certains cas, tous les individus présentant la caractéristique A comme s’ils possédaient la caractéristique B.

La notion de discrimination statistique a été développée par des économistes soucieux de parvenir à une explication satisfaisante de la persistance des discriminations sur le marché du travail (5). La conception traditionnelle de Gary Becker (1957) cherchait à expliquer de telles disparités par l’existence d’un «goût pour la discrimination», c’est-à-dire d’une préférence discriminatoire qui revient pour celui qui en est le porteur à attacher des coûts non pécuniaires au fait de s’associer avec les membres de certains groupes. Selon cette approche, un employeur n’acceptera d’embaucher de telles personnes que s’il peut leur verser, pour une productivité identique, une rémunération inférieure à celle des autres salariés; l’écart correspondant à la compensation du «coût psychologique» qu’implique la frustration de sa préférence discriminatoire. Cette approche se heurte toutefois à la difficulté d’expliquer la persistance des discriminations en situation de concurrence parfaite, puisque cette dernière est censée contraindre les agents qui cèdent à leur goût pour la discrimination à en supporter eux-mêmes le coût, ce qui les place dans une situation de désavantage compétitif par rapport aux agents économiques dépourvus de préjugés.

Le modèle de la discrimination statistique cherche quant à lui à expliquer la discrimination comme une réaction à une situation d’incertitude et d’information imparfaite. N’ayant que difficilement la possibilité d’observer chez les demandeurs d’emploi les caractéristiques économiques qui les intéressent réellement, les employeurs utilisent certaines propriétés facilement observables qui sont corrélées avec ces caractéristiques et qui en feront office d’indicateurs imparfaits. Ils construisent à l’aide de ces propriétés des catégories approximatives qui leur permettent d’aligner leurs décisions individuelles d’embauche ou de rémunération sur l’efficience moyenne des individus qui les composent, même si ces catégories ne forment pas des ensembles parfaitement homogènes. S’il s’avère qu’une caractéristique des candidats sans lien apparent avec leur productivité – comme leur sexe ou leur appartenance ethnique – se révèle être corrélée, même faiblement, à des caractéristiques liées à leur productivité, un preneur de décision peut être tenté de discriminer sur cette base. Il ne le fera pas parce qu’il éprouve une animosité à l’encontre des membres du groupe défini à partir de cette caractéristique, mais parce qu’il croit que la généralisation en question s’appuie sur une base factuelle suffisante pour servir de fondement pertinent à ses décisions.

Une discrimination statistique s’opère donc à l’encontre d’une catégorie d’individus sur le marché du travail lorsque ces individus sont défavorisés parce qu’ils possèdent des caractéristiques qui sont statistiquement corrélées avec des caractéristiques économiques dévalorisées par les employeurs. De façon générale, comme l’exprime Lester Thurow, «la discrimination statistique se produit chaque fois qu’un individu est jugé sur la base des caractéristiques moyennes du ou des groupes auxquels il appartient plutôt que sur la base de ses propres caractéristiques personnelles» (Thurow 1975, 172). À ce titre, la discrimination statistique constitue une pratique discriminatoire à l’encontre de certains individus, en l’occurrence ceux qui, bien qu’ils ne présentent pas eux-mêmes le trait associé au groupe auquel ils appartiennent, sont néanmoins désavantagés en raison de leur appartenance à celui-ci. Une discrimination individuelle est donc nécessairement exercée lorsque des individus sont jugés sur la base des caractéristiques moyennes de leur groupe plutôt que sur la base de leurs caractéristiques personnelles, sauf dans le cas très improbable où le groupe renvoie à un ensemble homogène.

En outre, la discrimination statistique produira fréquemment des effets discriminatoires à l’encontre des groupes eux-mêmes, et non seulement de certains des individus qui les composent. Certes, une différence de traitement entre les membres de différentes catégories ne produit pas nécessairement une discrimination de groupe si elle s’avère proportionnelle à leur différence de caractéristiques moyennes, par exemple si les écarts de salaire moyen entre les différents groupes sont, en fin de compte, proportionnels à leurs différentiels de productivité moyenne. La discrimination statistique peut toutefois conduire à des différences de traitement qui sont disproportionnées par rapport aux disparités auxquelles elle cherche à répondre. Le caractère dynamique des conséquences qu’elle peut avoir sur les individus et les groupes affectés rendra une telle disproportion plus vraisemblable encore. La discrimination statistique peut notamment constituer une incitation à ne pas chercher à démentir les croyances sur lesquelles elle se fonde et transformer ainsi ces croyances en prophéties autoréalisatrices (Sunstein 1997, 158). Un dernier facteur explique que la discrimination statistique puisse produire une discrimination de groupe. La situation dans laquelle les membres d’un groupe présentent une probabilité plus élevée de posséder une caractéristique jugée indésirable ne représente pas le seul cas de figure susceptible de motiver une discrimination statistique. Celle-ci peut également constituer une réponse rationnelle à une situation dans laquelle la caractéristique recherchée, bien qu’elle ne soit pas plus fréquente au sein d’un groupe donné, y est toutefois plus difficile à identifier ou y est distribuée de façon plus inégale, de sorte qu’elle représente malgré tout un risque plus important pour un agent extérieur (Plassard 1989).

3. Discrimination statistique, généralisation et arbitraire

Si la discrimination statistique constitue une forme de discrimination à l’encontre de certains individus, voire même à l’encontre de certains groupes, elle n’en demeure pas moins, dans certaines circonstances, une adaptation rationnelle à une réalité sociale au service de la poursuite d’une finalité légitime. À ce titre, elle pose un défi à notre compréhension habituelle des fondements de notre opposition morale aux pratiques discriminatoires. Le caractère arbitraire des distinctions qu’elles établissent semble en effet rendre compte de l’essentiel de la condamnation morale qui y est attachée.

Contre cette conception, la discussion de la notion de discrimination statistique met en évidence le fait que des caractéristiques en apparence aussi arbitraires que le genre ou l’appartenance ethnique d’un individu sont susceptibles de constituer, dans certaines circonstances, des substituts pertinents pour des caractéristiques qu’il est approprié de prendre en considération dans l’accomplissement d’un objectif social ou personnel légitime. Par définition, la discrimination statistique est présentée comme un mode de sélection qui n’est motivé par aucune préférence discriminatoire portant directement sur les caractéristiques visibles et qui n’utilise celles-ci qu’en raison de leur pertinence et de leur valeur informative relativement à d’autres caractéristiques des individus. La notion de discrimination statistique semble ainsi remettre en question l’hypothèse selon laquelle l’arbitraire constituerait une propriété nécessaire des pratiques discriminatoires.

On pourrait toutefois rétorquer qu’une telle conclusion est précipitée en ce qu’elle s’appuie sur une conception inadéquate de l’idée de pertinence. La discrimination statistique échappe certes à l’arbitraire qui consiste à fonder une différence de traitement sur un critère totalement non pertinent dans le seul but de satisfaire et d’exprimer une animosité ou une préoccupation morale différenciée à l’encontre de certains groupes. Elle revient néanmoins à attribuer une certaine propriété à un individu sur la seule base du fait qu’il partage une ressemblance avec des personnes qui tendent à posséder cette propriété, et donc en l’absence de toute preuve directe qu’il la possède lui-même. Or, affirmer que toutes les personnes devraient être jugées sur la base de caractéristiques individualisées, et non de choses sur lesquelles elles n’ont aucun contrôle comme leurs caractéristiques immuables ou les comportements d’autres personnes, semble être une façon de condamner l’arbitraire d’une prise de décision. Ainsi que l’exprime James Fishkin :

Une évaluation équitable des qualifications d’une personne doit reposer, fondamentalement, sur ses propres performances passées ou présentes, par exemple des examens, des expériences professionnelles antérieures ou toute autre expérience pertinente. En conséquence, la détermination des qualifications ne devrait pas se fonder uniquement sur des inférences statistiques (dérivées du comportement d’autres personnes) au sujet de la performance attendue d’une personne. […] Un individu appartenant à un groupe donné qui est sujet à une telle «discrimination statistique» n’aurait jamais reçu une chance de concourir, d’apporter la preuve de sa propre compétence. Il aurait été jugé entièrement sur la base de la performance d’autres personnes – de personnes qui se trouvent partager la même caractéristique arbitraire que lui (Fishkin 1983, 24).

Cette critique exprime des idées distinctes et il importe de séparer les différentes formes que peut prendre l’accusation selon laquelle la discrimination statistique, malgré la pertinence des inférences statistiques sur laquelle elle se fonde, constitue néanmoins une pratique arbitraire. La première affirmation est que c’est l’opération de catégorisation et de généralisation en elle-même – le fait de juger un individu en fonction de son appartenance à un groupe quel qu’il soit – qui est arbitraire; la seconde affirmation est que c’est l’utilisation de certaines caractéristiques particulières sur lesquelles s’opère cette généralisation – c’est-à-dire le fait de juger un individu en fonction de son appartenance à certains groupes particuliers – qui serait intrinsèquement arbitraire.

3. 1. L’arbitraire de la catégorisation

La première condamnation du caractère arbitraire de la discrimination statistique se fonde sur l’affirmation que les individus devraient être traités sur la base de leurs qualités individuelles et non en raison de leur appartenance à un quelconque groupe. Ce qu’il y a de répréhensible dans la discrimination, c’est qu’elle traite les individus comme s’ils sortaient tous du même moule au lieu de les considérer, précisément, comme des individus. Selon cette logique, c’est l’ensemble des processus de généralisation catégorielle qu’il s’agit de dénoncer. La réprobation morale des discriminations les plus criantes, celles qui se fondent par exemple sur la race ou le sexe des individus, serait dérivée de la condamnation plus générale d’un mode de pensée et d’action qui traite les individus en fonction de leur appartenance à un groupe. Une telle approche se heurte toutefois à un certain nombre de difficultés.

Afin d’illustrer certaines de ces difficultés, il est utile de partir d’un parallèle entre le phénomène de la discrimination statistique et les mécanismes d’assurance privée opérant une différentiation des assurés selon leurs probabilités de sinistre. L’assurance repose également sur la combinaison de l’incertitude individuelle et de la prévisibilité de groupe. Elle est fondée sur le principe de la mutualisation des risques et, partant, sur une forme de solidarité entre assurés qu’exprime le caractère redistributif de la relation entre les indemnités versées aux victimes d’un type particulier de sinistre et les primes payées par l’ensemble de ceux qui s’assurent contre ce sinistre. Dans le cas d’une assurance privée et concurrentielle comme l’assurance automobile, néanmoins, la solidarité recherchée est de type purement aléatoire. Elle repose sur l’idée que les primes doivent être plus ou moins proportionnées à la couverture et au niveau de risque estimé des détenteurs de police. Elle cherche à éviter autant que possible une redistribution involontaire entre les «bons» et les «mauvais» risques (6). Afin de réaliser entre les assurés une solidarité purement aléatoire, une assurance doit opérer une segmentation des risques, c’est-à-dire ventiler ceux-ci en groupes disposant d’estimations de sinistre différentes. À défaut d’une information parfaite sur l’évaluation des risques, l’assureur est contraint de recourir à un ensemble d’indicateurs lui permettant de répartir les assurés en classes relativement fines au sein desquelles le risque est à peu près homogène. C’est en vertu de ce principe que les primes d’assurance pour un jeune conducteur de sexe masculin venant d’acquérir son permis de conduire et circulant au volant d’une puissante voiture de sport seront par exemple plus élevées que la moyenne. En déterminant les primes des différentes catégories d’assurés en fonction de la probabilité d’accident correspondant à un membre aléatoire de chaque catégorie, la compagnie d’assurance opère pourtant une évaluation divorcée de tout fait concernant un conducteur particulier. La même prime s’appliquera à tout jeune conducteur masculin, même à celui qui est le parangon de la prudence et dont la probabilité d’être impliqué dans un accident est inférieure ou égale à celle de la plupart des conducteurs adultes. Une discrimination statistique s’exercera donc à son encontre.

L’analogie avec le mécanisme de l’assurance illustre le premier problème auquel s’expose la tentative d’expliquer le caractère moralement répréhensible de la discrimination statistique par le phénomène de la prise de décision non individualisée, à savoir que nous acceptons de telles prises de décision dans quantité de domaines de la vie sociale. Un nombre considérable de situations nous conduisent en effet à adopter des jugements probabilistes et des prises de décision actuarielles, c’est-à-dire des jugements et des décisions qui concernent tous les membres d’une classe en vertu de ce qui n’est vrai que de certains d’entre eux. L’assurance n’en est qu’un exemple parmi d’autres (7). Faire de la généralisation la propriété moralement pertinente ne permet dès lors pas de rendre compte de la signification particulière que revêtent à nos yeux les formes les plus manifestes de discrimination par rapport aux situations dans lesquelles un individu est considéré comme un élément d’une catégorie statistique non dénuée de pertinence. Supposons par exemple que l’âge du conducteur, son sexe, le type de véhicule qu’il conduit, son lieu de résidence et son origine nationale constituent autant de critères également pertinents pour estimer le risque d’accident d’un automobiliste. Il existe peut-être de bonnes raisons de contester le recours à certains de ces indicateurs en dépit de leur pertinence statistique – le sexe ou l’origine nationale, par exemple. L’affirmation qu’il est injuste de traiter un individu en fonction de son appartenance à un groupe ne saurait toutefois constituer l’une de ces raisons, puisque cette affirmation serait tout autant opposable à l’utilisation des autres critères de différenciation jugés plus acceptables.

L’exemple de l’assurance permet par ailleurs d’illustrer le fait que la recherche d’une meilleure « individualisation » des primes passe par une multiplication des critères de différenciation et donc par le rattachement des individus à un nombre toujours plus important de groupes statistiquement pertinents. La discrimination statistique, dans un tel contexte, est d’autant plus réduite que les groupes sur la base desquels les individus sont jugés sont plus homogènes. Interdire des critères de différenciation pertinents revient à accroître le nombre de personnes qui seront rangées dans des catégories auxquelles elles ont le sentiment de ne pas appartenir. C’est bien l’exigence d’individualisation, en effet, qui conduit à différencier des individus en fonction de leur appartenance à des groupes. Il s’agit d’une illustration du fait que la volonté d’acquérir une information plus individualisée dans le but de réduire la discrimination née de l’imprécision statistique peut également générer sa propre désutilité (8).

La tentative d’expliquer l’arbitraire de la discrimination statistique par le caractère non individualisé de la prise de décision se heurte également au constat que la distinction entre caractéristiques individuelles et caractéristiques de groupe s’avère notoirement problématique. Il convient en effet de relativiser l’opposition ainsi présupposée entre des décisions fondées sur des généralisations ou des inférences statistiques, d’une part, et des jugements qui seraient individualisés, c’est-à-dire portés sur des individus en fonction de traits de personnalité qui leur sont propres, d’autre part. Comme le souligne Michael Levin:

Les personnes sont toujours, et ne peuvent pas ne pas être, jugées selon les classes dans lesquelles elles se rangent et selon les traits qu’elles partagent avec d’autres personnes. Ce que l’on appelle des traits individuels ou intrinsèques sont simplement des traits qui, étant donnée notre expérience antérieure avec d’autres personnes possédant ces mêmes traits, sont réputés avoir une valeur prédictive élevée (Levin 1992, 23).

Ainsi, le fait de juger un individu selon des caractéristiques personnelles qu’on lui connaît – par exemple selon des traits de son caractère ou des performances passées – consiste dans une large mesure à anticiper son comportement sur la base de corrélations préalablement observées entre ces propriétés et l’expérience que nous avons de la manière dont les personnes qui les possèdent ont tendance à se comporter dans certaines circonstances (Sher 1987, 195). Il en résulte que de nombreuses évaluations dites «individualisées» s’apparentent en fait à des prédictions de nature probabiliste (Schauer 2003, 65-67). La prise en compte des performances scolaires afin de déterminer l’admission d’un candidat à une formation ou à un emploi ne saurait par exemple être conçue comme une récompense destinée à honorer le mérite de ses propres performances antérieures. Elle est plutôt justifiée par les vertus prédictives attribuées à ses performances passées en tant qu’indices de ses probables performances futures. À ce titre, elle revient également à juger un individu en fonction de son appartenance à un groupe. L’évaluation qui est faite de ses performances n’est que l’anticipation de certaines aptitudes généralement manifestées par les personnes ayant accompli des performances semblables. En valorisant certains types de diplômes ou d’expériences passées, un employeur suppose que les personnes en possession de ce diplôme ou de cette expérience tendent généralement à présenter certaines qualités et compétences qu’il recherche. Il sait que de tels critères ne sont pas infaillibles, mais estime soit qu’il ne dispose pas de possibilités de sélection plus précises, soit que la valeur prédictive de ces possibilités ne justifie pas les coûts qu’elles impliquent par ailleurs.

Une dernière difficulté à laquelle s’expose l’exigence d’individualisation mérite d’être signalée dans le cadre d’une discussion sur les discriminations. Paradoxalement, la reconnaissance même de l’existence d’une discrimination doit parfois s’appuyer sur des jugements probabilistes fondés sur des généralisations portant sur des classes d’individus. Il se peut en effet que le caractère discriminatoire – par exemple raciste – d’une pratique ne puisse être démontré qu’au niveau du groupe des personnes qui en sont les victimes et non de chacune des victimes individuelles. Le jugement rendu par la Cour Suprême des États-Unis dans l’affaire McCleskey c. Kemp (9) permet d’illustrer cette possibilité. En 1978, un jeune homme noir du nom de Warren McCleskey fut condamné à la peine capitale par une cour de l’État de Géorgie pour vol à main armée et meurtre d’un policier blanc. Le condamné sollicita l’annulation de la condamnation par la voie d’un recours d’habeas corpus auprès de la Cour Suprême. Il fit valoir une étude statistique qui démontrait que la fréquence des condamnations à mort était très inégalement répartie selon la race de la victime et celle de l’inculpé. Cette étude établissait notamment que les Noirs qui avaient tué des Blancs étaient, parmi tous les inculpés reconnus coupables de meurtre, ceux qui étaient davantage exposés au risque de se voir condamner à la peine de mort (10). La majorité des juges de la Cour Suprême rejeta toutefois le recours en arguant du fait que McCleskey n’avait avancé aucun élément de preuve spécifique permettant d’établir que les juges avaient dans son cas pris leur décision avec une volonté délibérée de discrimination. McCleskey a été exécuté le 25 septembre 1991. Son problème était comparable à celui des «victimes statistiques», causées par exemple par l’exposition prolongée à une substance chimique nocive : si leur existence est démontrée par les données épidémiologiques, elles sont toutefois impossibles à désigner en tant qu’individus.

3. 2. L’arbitraire des catégories

Ce n’est donc pas l’opération de catégorisation en elle-même, c’est-à-dire le fait de juger un individu en fonction de son appartenance à un groupe, qui permet d’affirmer le caractère arbitraire de la discrimination statistique. Une autre façon de chercher à établir cette démonstration consiste à affirmer que c’est moins les opérations de catégorisation et de généralisation en tant que telles qui seraient problématiques que l’utilisation de certaines caractéristiques particulières comme bases de ces généralisations.

Cette stratégie revient à contester que la discrimination statistique puisse être pertinente lorsqu’elle s’appuie sur des caractéristiques telles que le genre, la race ou l’orientation sexuelle d’une personne. Certes, il est possible qu’une corrélation statistique existe entre ces caractéristiques et d’autres caractéristiques préjudiciables à la réalisation d’un objectif légitime. Toute la discussion autour de la discrimination statistique présuppose une telle éventualité. L’existence d’une telle corrélation ne serait toutefois pas encore suffisante pour garantir la pertinence d’une différence de traitement sur cette base. S’il semble arbitraire de fonder une différence de traitement sur des inférences statistiques, en effet, c’est non seulement parce que celles-ci n’expriment que de simples probabilités, mais aussi parce qu’il semble injuste d’agir sur la base de considérations détachées de tout ce sur quoi les individus peuvent avoir prise. Afin de pouvoir justifier une différence de traitement sur la base d’une corrélation statistique, il faudrait pouvoir conférer à celle-ci une signification qui aille au-delà du simple constat d’une coïncidence fortuite. L’arbitraire d’une discrimination statistique opérée sur la base d’une caractéristique telle que le sexe ou la race proviendrait ainsi du fait que ces caractéristiques sont immuables et semblent dépourvues de toute relation causale avec les structures comportementales dont elles servent d’indicateurs.

Dans sa discussion de l’acceptabilité morale de la discrimination statistique, le philosophe Joel Feinberg attache une importance déterminante à l’absence d’une relation causale permettant d’expliquer la corrélation entre les propriétés recherchées et les propriétés visibles sur lesquelles s’appuie la discrimination. Même si une corrélation statistique significative était établie entre l’âge ou l’origine ethnique des conducteurs de voiture et un risque accru d’accidents de la circulation, affirme-t-il, il n’en serait pas moins illégitime de tenir compte de ces données pour fonder une différence de traitement. L’existence d’une telle corrélation, en effet, ne change rien au fait que l’âge ou l’origine ethnique d’un individu ne constitue pas en tant que tel la cause d’un risque d’accident plus élevé:

Dans de telles situations hypothétiques, et en dépit de son efficacité à réduire les dommages, la discrimination statistique est manifestement illégitime et la raison en est claire. La corrélation entre l’appartenance à une classe statistique et un type déterminé de comportement n’établit aucun lien entre ce comportement et un quelconque facteur pertinent d’un point de vue causal que possèderait chaque membre de la classe considérée. Le fait qu’une personne donnée appartienne à une classe statistiquement dangereuse est une raison de la soupçonner de pouvoir présenter la propriété causalement reliée au danger, mais l’appartenance à cette classe elle-même ne saurait représenter une telle propriété. Rien dans le simple fait d’être un septuagénaire n’est nécessairement et toujours (ou même généralement) relié au fait d’être un conducteur dangereux. Les individus qui sont particulièrement dangereux ne le sont pas en vertu de leur âge, mais en vertu d’une certaine condition physique qui résulte fréquemment, mais pas universellement, de leur âge (Feinberg 1984, 201; voir également Bowie 1994, 209).

Une telle critique s’apparente toutefois à une pétition de principe. L’impossibilité de repérer la présence de la propriété véritablement déterminante est précisément le problème auquel la discrimination statistique cherche à apporter une solution. C’est bien parce que cette propriété demeure inaccessible que la sélection s’opère sur la base d’une caractéristique qui lui est statistiquement corrélée et qui n’est donc pas la propriété réellement déterminante elle-même. En outre, s’il peut y avoir de bonnes raisons de ne pas agir sur la base de telles corrélations, elles proviennent essentiellement de leur caractère imparfait et du risque d’erreur qu’elles impliquent. La pertinence ou absence de pertinence causale des critères potentiels de décision ne semble dans cette perspective pas revêtir d’autre signification que leur contribution à la valeur prédictive de ces corrélations. Même s’il s’avère que les critères causaux constituent de bons instruments de prédiction de la caractéristique recherchée, c’est la valeur informative et prédictive d’un critère elle-même, et non la raison pour laquelle il possède une telle valeur, qui en justifie l’utilisation pour la recherche de l’information pertinente. De manière générale, une propriété A est un indicateur d’autant plus pertinent de la propriété B que la probabilité p(B/A) est plus élevée. Comme le souligne Michael Levin,

le fait que l’existence de relations causales entre A et B détermine souvent le niveau de p(B/A) nourrit la confusion entre une justification de cette probabilité et sa base causale habituelle. Or, c’est la valeur de p(B/A), quelle que soit sa base, qui justifie une inférence de A à B, et qui la justifierait même si elle ne valait qu’en raison de corrélations inexpliquées mais néanmoins prévisibles (Levin 1992, 15).

Supposons par exemple que notre objectif soit de sélectionner le meilleur candidat pour un poste et que l’on estime que le meilleur candidat est celui qui a le plus de chances de faire preuve des meilleures performances à cette fonction. S’il s’avère que des prédictions fondées sur des inférences statistiques non liées aux actions de la personne se révèlent plus précises que des prédictions fondées sur certaines de ses actions antérieures, pourquoi faudrait-il néanmoins privilégier celles-ci au détriment de celles-là ? Qu’est-ce qui nous autoriserait à prétendre que la personne sélectionnée sur la base d’un critère ayant une valeur prédictive plus faible mériterait davantage ce poste alors même qu’on augmente le risque qu’une personne mieux qualifiée ait été écartée en sa faveur? (Sher 1987, 192).

L’utilisation de la notion de causalité dans l’étude des phénomènes sociaux s’avère en outre extrêmement problématique. On peut se demander si les hommes ont une espérance de vie plus courte que les femmes pour des raisons biologiques ou parce qu’ils tendent à accorder moins d’attention à leur santé, à s’exposer davantage à des situations dangereuses et à exercer des métiers plus pénibles ; ou encore si les jeunes conducteurs masculins ont plus d’accidents de la circulation que les conductrices du même âge à cause de la testostérone ou, comme certaines études l’affirment, parce que leur situation professionnelle les amène à devoir parcourir de plus longues distances dans des conditions moins favorables (Flanagan 1985, 731). À supposer que l’on parvienne à privilégier clairement l’un de ces deux types de réponse, il est difficile de voir en quoi cela modifierait l’évaluation du caractère arbitraire ou pertinent d’une discrimination statistique reposant sur de telles corrélations.

4. Les fondements moraux pertinents

Les considérations qui précèdent ont cherché à démontrer que le fait de juger un individu en fonction de son appartenance à un groupe ne suffit pas à établir le caractère arbitraire de la discrimination statistique. Celle-ci peut toutefois s’avérer moralement condamnable pour d’autres raisons, notamment lorsqu’elle se fonde sur certaines caractéristiques.

Le fondement moral de l’opposition aux multiples formes de discrimination ne doit en effet pas tant être recherché dans la nature arbitraire des distinctions qu’elles établissent que dans les conséquences qui sont les leurs. Le caractère moralement répréhensible des discriminations résulte essentiellement des dommages qu’elles occasionnent à l’autonomie des membres des groupes désavantagés, c’est-à-dire à l’idéal d’une vie qui dispose d’une gamme d’options suffisamment adéquate pour que son auteur soit en mesure d’en déterminer lui-même la forme et le contenu. Les discriminations, notamment lorsqu’elles prennent un caractère endémique, tendent en effet à nier à un individu la possibilité de mener une existence autonome, ne lui laissant qu’une gamme trop restreinte d’options valables pour exercer sa capacité de choix (Gardner 1998). Cette remarque rend compte du fait que le préjudice provoqué par un comportement discriminatoire ne revêt pas la même signification morale selon qu’il constitue un comportement occasionnel dirigé contre les membres d’un groupe défini de manière idiosyncrasique ou qu’il se trouve enchâssé dans une configuration de pratiques discriminatoires généralisées et répétées à l’encontre d’un groupe largement subordonné ou stigmatisé. Dans cette perspective, le désavantage cumulatif provoqué par l’utilisation répétée de l’appartenance à un groupe comme substitut d’une autre caractéristique peut procurer une raison indépendante de désapprouver les décisions fondées sur l’appartenance à ce groupe, quelle que soit l’honnêteté du processus au moyen duquel ces décisions sont prises et quelle que soit la légitimité des finalités personnelles ou sociales poursuivies.

J’aimerais encore indiquer, en guise de conclusion, deux raisons morales plus directement liées au mécanisme même de la discrimination statistique et susceptibles de fonder la condamnation de l’utilisation qui peut en être faite.

La première remarque est qu’il n’est pas approprié, sur le plan moral, de faire abstraction des raisons de l’existence de certaines corrélations statistiques. Il convient par exemple de s’interroger sur les raisons pour lesquelles une caractéristique à première vue si peu pertinente que la couleur de peau d’une personne en est venue, aux États-Unis, à constituer un indicateur significatif de son niveau de criminalité. L’hypothèse la plus vraisemblable est que cette corrélation est elle-même l’une des multiples conséquences des discriminations passées et présentes exercées à l’encontre de la population noire. Or, la nature de cette explication pourrait, du moins jusqu’à un certain point, condamner les formes de discrimination statistique qui prennent appui sur cette corrélation.

Kasper Lippert-Rasmussen (2006) a développé une argumentation en ce sens. Il a suggéré que la tentative de justifier le «profilage racial» – c’est-à-dire le fait de procéder à des interpellations sélectives en fonction de l’identité raciale des individus – à l’encontre d’une catégorie de la population en raison de son taux de criminalité plus élevé peut, dans certaines circonstances, être soumise à une critique comparable à l’ «argument des incitants» que G. A. Cohen (1992) oppose au principe de différence de Rawls. Cohen conteste l’idée que, dans une société rawlsienne, les personnes les plus favorisées puissent faire appel au principe de différence afin de justifier des inégalités qui ne s’avèrent nécessaires à l’amélioration du sort des plus défavorisés que parce qu’elles ont elles-mêmes décidé de conditionner le plein déploiement de leur force productive à l’existence d’incitations génératrices d’inégalités. Une telle justification de ces inégalités ne serait pas compatible avec ce que Cohen appelle une «communauté de justification», puisque les personnes les plus favorisées ne peuvent demander aux plus mal lotis d’accepter des inégalités qu’elles contribuent elles-mêmes à rendre nécessaires.

De manière similaire, estime Lippert-Rasmussen, exercer un profilage racial à l’encontre de la communauté noire aux États-Unis revient à considérer qu’en raison de son taux de criminalité plus élevé, il est légitime d’exiger de cette communauté une contribution plus importante à réalisation du bien public que représente la réduction de la criminalité. Cette justification est toutefois illégitime s’il est vrai que le taux de criminalité plus élevé de la population noire est en grande partie la conséquence de la discrimination et de l’injustice raciales dont elle est par ailleurs la victime et si la population blanche n’entreprend pas tout ce qui est en son pouvoir pour remédier à cette situation. En effet, la population blanche ne peut pas justifier auprès de la communauté noire une contribution plus importante à la baisse de la criminalité alors qu’elle est elle-même responsable de la situation qui rend cette contribution nécessaire. Une telle attitude démontrerait que la population blanche ne perçoit pas que ses relations avec la population noire impliquent une communauté de justification.

La seconde remarque est que la différence entre la discrimination statistique et les formes de discrimination motivées par une animosité à l’encontre des membres de certains groupes, pour claire et fondamentale qu’elle puisse être en théorie, s’avère excessivement difficile à tracer et à préserver en pratique. La généralisation d’une caractéristique négative à l’ensemble d’un groupe sert souvent à véhiculer une hostilité à l’encontre de ses membres. Des comportements s’apparentant à de la discrimination statistique peuvent en conséquence rationaliser des formes de discrimination par goût. Différentes réactions émotionnelles et préventions cognitives plus ou moins inconscientes peuvent infecter une décision censée s’appuyer sur une généralisation pertinente. Les préjugés et les stéréotypes au sujet de certains groupes se forment et se répandent en effet au sein de la société d’une façon qui interdit de les réduire à des croyances explicites et conscientes. Ils façonnent en profondeur la perception que les agents se font des groupes en question et se traduisent inévitablement par une série d’effets déformants sur les généralisations que ces agents opèrent. L’existence d’un préjugé peut par exemple se manifester par une forme de sélectivité qui conduit à privilégier un indicateur au détriment d’autres caractéristiques présentant pourtant un pouvoir prédictif au moins équivalant. Il en va de même de la décision de sélectionner des individus sur la base d’une caractéristique visible alors que le pouvoir prédictif de ce critère est si faible qu’il aurait été ordinairement repoussé (Sunstein 1997, 156).

Une des caractéristiques des généralisations reposant sur l’appartenance à des groupes stigmatisés, même lorsque ces généralisations ne sont pas entièrement fallacieuses, est en outre que l’utilisation qui en est faite va souvent bien au-delà de leur réelle capacité prédictive, sans qu’il soit pour autant facile de différencier les utilisations appropriées des utilisations abusives. C’est l’une des multiples raisons pour lesquelles les généralisations fondées sur l’appartenance à des groupes largement stigmatisés et les utilisations susceptibles d’être faites de ces généralisations doivent être qualifiées, en général, de suspectes. Et cela constitue peut-être à son tour la meilleure raison que nous pouvons avoir de vouloir interdire l’utilisation de certaines de ces généralisations, quand bien même on sait que cette interdiction reviendrait, dans certains cas, à devoir se priver de l’utilisation appropriée de généralisations non arbitraires. Force est néanmoins de reconnaître que la justification de cette prohibition prendrait alors elle-même la forme d’une généralisation statistiquement fondée mais non universelle.

5. Conclusion

L’objectif de cette discussion a été d’examiner si l’arbitraire constitue une condition nécessaire des discriminations et de la condamnation morale qui y est attachée. Le phénomène de la discrimination statistique m’a semblé présenter un intérêt particulier à cet égard. En effet, si la discrimination statistique représente bel et bien une forme de discrimination à l’encontre de certains individus, voire même à l’encontre de certains groupes, elle a néanmoins pour particularité de s’appuyer sur des corrélations statistiques non dénuées de pertinence. À ce titre, elle pose un défi à notre compréhension habituelle des fondements de notre condamnation morale des discriminations.

Afin de mesurer l’ampleur de ce défi, je me suis demandé si les discriminations statistiques ne pouvaient pas être accusées d’arbitraire malgré la pertinence des inférences statistiques sur lesquelles elles reposent. J’ai distingué deux formes que pouvait prendre cette affirmation. La première approche considère qu’il est toujours arbitraire et condamnable de juger un individu en fonction de son appartenance à un groupe plutôt que sur la base de ses caractéristiques individuelles. Contre cette première approche, j’ai souligné que la tentative de faire de la généralisation la propriété moralement pertinente des discriminations n’est pas concluante et que l’opération de catégorisation en tant que telle n’autorise pas à affirmer le caractère arbitraire de la discrimination statistique.

La seconde approche envisagée considère que ce sont moins les opérations de catégorisation et de généralisation en tant que telles qui seraient problématiques d’un point de vue moral que l’utilisation de certaines caractéristiques particulières comme bases de ces généralisations. En d’autres termes, l’arbitraire de la discrimination statistique ne consisterait pas à juger un individu en raison de son appartenance à un groupe quel qu’il soit, mais plutôt à le juger en raison de son rattachement à certains groupes particuliers, en l’occurrence les groupes définis sur la base de caractéristiques immuables qui échappent au contrôle individuel et qui semblent détachées de toute relation causale avec les structures comportementales dont elles servent d’indicateurs.

Contre cette seconde approche, j’ai soutenu que si le caractère moralement problématique des discriminations doit bien être recherché dans le fait de juger et de traiter les individus en fonction de leur appartenance à certains groupes, ce n’est pas principalement en raison du caractère intrinsèquement arbitraire de ces groupes, mais plutôt en raison de leur position extrinsèque au sein de rapports de subordination et de stigmatisation. La discrimination statistique est moralement problématique lorsqu’elle s’inscrit dans une configuration de pratiques discriminatoires à l’encontre de groupes déjà subordonnés ou stigmatisés et lorsqu’elle contribue à perpétuer et à renforcer ces relations au point d’en devenir indissociable.

Références bibliographiques

Aigner, Dennis J., and Glen G. Cain, 1977, « Statistical Theories of Discrimination in Labor Markets », Industrial & Labor Relations Review, 30 (2), p. 175-187.

Armour, Jody D., 1994, « Race Ipsa Loquitur: Of Reasonable Racists, Intelligent Bayesians, and Involuntary Negrophobes », Stanford Law Review, 46 (4), p. 781-816.

Becker, Gary S., 1957, The Economics of Discrimination, Chicago, University of Chicago Press.

Bowie, Norman E., 1994, « Statistical Discrimination and Public Policy », in Richard T. Hull (ed.), A Quarter Century of Value Inquiry: Presidential Addresses before the American Society for Value Inquiry, Amsterdam, Rodopi, p. 205-220.

Cohen, G. A., 1992, « Incentives, Inequality and Community », in The Tanner Lectures on Human Values, Salt Lake City, University of Utah Press, vol. 13, p. 261-329.

Feinberg, Joel, 1984, Harm to Others (The Moral Limits of the Criminal Law; vol 1), New York, Oxford University Press.

Fishkin, James S., 1983, Justice, Equal Opportunity, and the Family, New Haven, Yale University Press.

Flanagan, Thomas, 1985, « Insurance, Human Rights, and Equality Rights in Canada: When Is Discrimination “Reasonable?” », Canadian Journal of Political Science, 8 (4), p. 715-737.

Gardner, John, 1998, « On the Ground of Her Sex(uality) », Oxford Journal of Legal Studies, 18 (1), p. 167-187.

Levin, Michael E., 1992, « Responses to Race Differences in Crime », Journal of Social Philosophy, 23 (1), p. 5-29.

Lippert-Rasmussen, Kasper, 2006, « Racial Profiling versus Community », Journal of Applied Philosophy, 23 (1), p. 141-155.

Maitzen, Stephen, 1991, « The Ethics of Statistical Discrimination », Social Theory & Practice, 17 (1), p. 23-45.

Phelps, Edmund S., 1972, « The Statistical Theory of Racism and Sexism », American Economic Review, 62 (4), p. 659-661.

Plassard, Jean-Michel, 1989, « Discrimination statistique et marché du travail », Recherches économiques de Louvain, 55 (2), p. 177-202.

Rüegger, Marc, 2003, « Discrimination statistique, généralisation et racisme », Carnets de bord, n° 6, p. 5-18.

Schauer, Frederick F., 2003, Profiles, Probabilities, and Stereotypes, Cambridge, Harvard University Press.

Sher, George, 1987, « Predicting Performance », Social Philosophy & Policy, 5 (1), p. 188-203.

Sunstein, Cass R., 1997, Free Markets and Social Justice, New York, Oxford University Press.

Thurow, Lester C., 1975, Generating Inequality: Mechanisms of Distribution in the U.S. Economy, New York, Basic Books.



(1) Cité in Jean-Yves Nau, « L’exclusion permanente des homosexuels masculins du don du sang suscite une polémique », Le Monde, 15 juin 2006.

(2) Newsweek, 13 décembre 1993, p. 17, cité in Armour 1994, 790.

(3) Voir Crime in the United States 2005 (Washington DC, US Department of Justice, Federal Bureau of Investigation, 2006), Expanded Homicide Data Table 3. <http://www.fbi.gov/ucr/05cius/offenses/expanded_information/data/shrtable_03.html>

(4) La présentation qui suit synthétise des éléments développés plus en détail in Rüegger 2003.

(5) Sur ce sujet, voir notamment Phelps 1972, Aigner & Cain 1977, Plassard 1989.

(6) Évidemment, une société peut, pour certains types de risques particuliers, chercher à ne précisément pas éliminer la solidarité par subventionnement et instaurer un mécanisme assurantiel qui repose sur l’ignorance des critères de risque. Elle pourrait par exemple considérer qu’il s’agit du type d’assurance que choisiraient des individus placés derrière un voile d’ignorance; l’absence d’information quant aux caractéristiques particulières des individus étant alors recherchée comme la marque d’une procédure de choix équitable.

(7) Pour une analyse des différentes manifestations de la prise de décision non individualisée, voir Schauer 2003.

(8) Une autre source importante de désutilité est l’aspect potentiellement intrusif de son obtention, voir Maitzen 1991, 40. L’exemple de l’assurance automobile est là encore instructif, à l’heure où certaines compagnies d’assurance proposent l’installation dans le véhicule de l’assuré d’un terminal de surveillance qui enregistre des informations liées à ses déplacements et à ses comportements de conduite afin de déterminer le montant de sa prime.

(9) U.S. Supreme Court. McCleskey v. Kemp, 481 U.S. 279 (1987). Voir: http://laws.findlaw.com/us/481/279.html

(10) Cette étude statistique, connue sous le nom de «rapport Baldus», établissait que la peine capitale avait été infligée dans 22% des cas impliquant des inculpés noirs et des victimes de race blanche; dans 8% des cas impliquant des inculpés blancs et des victimes de race blanche; dans 1% des cas impliquant des inculpés noirs et des victimes de race noire; et dans 3% des cas impliquant des inculpés blancs et des victimes de race noire. Le rapport révélait également que le ministère public avait requis la peine de mort dans 70% des cas impliquant des inculpés noirs et des victimes de race blanche; dans 32% des cas impliquant des inculpés blancs et des victimes de race blanche; dans 15% des cas impliquant des inculpés noirs et des victimes de race noire; et dans 19% des cas impliquant des inculpés blancs et des victimes de race noire (Idem).