Par Nicolas Bouleau
Peu de temps après la parution du premier rapport au Club de Rome (1972), et du très célèbre livre de Jacques Monod où celui-ci posait que l’évolution procédait par le hasard, dès 1978, Georges Matheron publiait un essai — Estimer et choisir — dans lequel il prenait le contrepied du grand biologiste affirmant que celui-ci avait commis une grave erreur, fréquente dans les interprétations des statistiques. La vision de Monod, qui s’est répandue en véritable dogme fondateur de la biologie de synthèse, rencontre aujourd’hui de plus en plus de critiques sur la confusion qu’elle fait entre le modèle probabiliste et la réalité, notamment en sous-estimant le contexte et les circonstances. Il s’agit surtout ici de présenter la pensée de Matheron et de mettre en lumière sa portée épistémologique.
I/ Pour bien faire sentir que la vision de Georges Matheron est une position modérée, disons d’abord quelques mots du point de vue de René Thom.
Celui-ci publie en 1980 dans la revue Le Débat un article intitulé « Halte au hasard, silence au bruit« dans lequel il dénonce la « fascination de l’aléatoire qui témoigne d’une attitude antiscientifique par excellence ».
« Affirmer que « le hasard existe », écrit-il, c’est prendre cette position ontologique qu’il y a des phénomènes naturels que nous ne pourrons jamais décrire, donc jamais comprendre » ; « en quoi l’appel au hasard pour expliquer l’évolution serait-il plus scientifique que l’appel à la volonté du Créateur ? »
L’article de Thom est très véhément mais assez confus, il rejette même l’idée que le hasard soit une représentation asymptotique dans des situations idéales. Il considère que c’est la recherche des déterminismes qui est intéressante dans la science : « Que gagne-t-on à enrober le squelette du déterminisme dans une couche de graisse statistique »…
Pour Thom introduire le hasard dans les représentations de la nature est une solution de facilité qui signifie : pas la peine d’aller plus loin dans notre recherche de compréhension.
II/ Une dizaine d’années auparavant, Jacques Monod dans Le hasard et la nécessité avait proposé la thèse que toute la nature était le résultat du hasard, la fameuse « roulette de la nature », avec cette célèbre phrase provocante :
» Nous disons que ces altérations sont accidentelles, qu’elles ont lieu au hasard. Et, puisqu’elles constituent la seule source possible de modifications du texte génétique, seul dépositaire à son tour des structures héréditaires de l’organisme, il s’ensuit nécessairement que le hasard est la seule source de toute nouveauté, de toute création dans la biosphère. Le hasard pur, le seul hasard, liberté absolue, mais aveugle, à la racine même du prodigieux édifice de l’évolution. »
Et nombreux sont ceux qui se sont levés contre cette idée, y compris des scientifiques. Thom est loin d’être le seul à critiquer Monod, on peut citer Albert Jacquard, le biologiste Schoffeniels, et beaucoup d’autres, qui dénoncèrent cet appel au hasard qui dit au fond « ne cherchez pas à comprendre, inutile d’aller plus loin ».
III/ Parmi les critiques de Monod, celle de Georges Matheron est particulièrement intéressante parce qu’elle se situe à la juste place, là où le problème est épistémologiquement difficile. Quand bien même nous considérerions que les phénomènes biologiques sont le résultat du hasard, de ce hasard nous n’avons qu’un seul tirage, une seule trajectoire ; et ce qu’est la nature aujourd’hui – et ce qu’elle fut dans le passé – induit une foule de déterminismes, de sorte que le problème est de partager les sources de hasard s’il y en a, et les causalités multiples et contextuelles. Il n’y a effectivement qu’une seule nature avec un seul parcours, si divers et riche fût-il, et sur une seule planète. La comparaison avec le hasard et sa roulette à multiples tirages est ainsi une pure abstraction. On voit que la question est très générale et concerne la méthode elle-même des sciences de la nature.
Georges Matheron (1930-2000) est considéré comme le fondateur des statistiques spatiales (Agterberg 2004), du moins fondateur avec les moyens conceptuels du 20e siècle, car au niveau de l’artisanat il y eut évidemment Buffon avec ses « Probabilités géométriques » dès le 18e siècle. Ce dernier écrit dans son Essai d’Arithmétique morale [1] : « L’Analyse est le seul instrument dont on se soit servi jusqu’à ce jour dans la science des probabilités, […] la géométrie paraissait peu propre à un ouvrage aussi délié ; cependant si on y regarde de près […] le hasard selon qu’il est modifié et conditionné, se trouve du ressort de la Géométrie aussi bien que de celui de l’Analyse » ; et de prendre l’exemple d’une pièce jetée sur un carrelage puis d’une aiguille sur un parquet.
En 1954 Georges Matheron commence à travailler sur les variables régionalisées, généralisant les méthodes de prospection géologiques de l’ingénieur Danie Krige. En 1968 il fonde le Centre de géostatistiques de l’École des Mines à Fontainebleau. Son livre Random Sets and Integral Geometry (1975) introduit plusieurs nouveaux concepts sur les répartitions aléatoires, les mesures aléatoires de Poisson et leurs transformées.
Il est connu aussi pour ses clarifications en philosophie des sciences notamment par son essai Estimer et Choisir (1978) (Estimating and Choosing, 1989) sur lequel nous allons nous appuyer.
IV – Estimer et choisir
A) Matheron commence son essai par un chapitre intitulé : « Le hasard chez J. Monod ou comment on franchit les limites de l’objectivité ».
Il est curieux que Matheron critique un manque d’objectivité chez Monod, car la démarche de Monod peut être considérée comme dissimulant des phénomènes complexes intéressants (Schoffenhiels, Jacquard), mais le hasard ne semble pas privilégier un point de vue subjectif. Dire qu’un phénomène se produit au hasard, c’est adopter un point de vue universaliste et objectif, sans égard à quelque subjectivité que ce soit.[2]
C’est là qu’apparaît déjà la profondeur du propos de Matheron. Rappelons qu’il est de multiples hasards et modèles afférents possibles, et qu’il est dépourvu de sens de parler de hasard sans préciser de quel hasard on parle. C’est le choix d’adopter un modèle au hasard qui n’est pas objectif, mais culturel et social, car l’expérience nous révèle une réalité qui ne parle pas comme un modèle au hasard, mais comme une singularité tout à fait spécifique.
Il souligne d’abord que le hasard est un « concept métaphysique », alors que lui se place du point de vue empirique. Il écrit :
« Dans le domaine des disciplines empiriques, nous ne pouvons pas extrapoler à l’infini une théorie, si bien corroborée soit-elle, sans sortir ipso facto des limites à l’intérieur desquelles cette théorie possède un sens opératoire et a reçu la sanction de l’expérience ».
La remarque est très proche – et je crois indépendante – de la célèbre thèse de Quine sur la sous-détermination des théories par l’expérience.[3]
Il reprend le « paradoxe » du couvreur qui fait tomber une tuile juste sur le médecin qui sort de chez lui pour une visite, anecdote ancienne qui soi-disant fournit un « hasard absolu », parce que les événements n’ont « rien à voir ». Il explique que pour objectiver, il faut replacer l’ouvrier dans une stationnarité et le médecin aussi. Et qu’alors la relation d’indépendance p(AB)=p(A)p(B) est surement fausse parce que durant la nuit les deux sont inactifs. Couvreur et médecin dorment; s’ils sortent, c’est au matin, etc. Il y a donc bien des corrélations de part et d’autre.
Il prend ensuite le cas des chaines polypeptidiques où se succèdent dans un ordre variable certains des 20 acides aminés formant ainsi une protéine. Il arrive à la conclusion que les acides aminés ne sont pas répartis comme s’ils avaient été tirés au hasard. Il utilise un argument d’ordre de grandeur.
« Il est vraisemblable, écrit-il, que J. Monod a conçu sa philosophie, avant tout, comme une machine de guerre contre celle de Teilhard de Chardin. C’est ce qui explique leur parenté. Le hasard de Monod est le frère ennemi du point Omega du bon père. Son ennemi certes, mais essentiellement son frère. Ils sont bien de la même famille. »
Matheron dégage de ce chapitre le concept de « seuil d’objectivité » qui se comprend de la façon suivante :
« un modèle donné, aussi bien testé et corroboré qu’il ait pu être, contient toujours et nécessairement des théorèmes qui ne correspondent plus à des énoncés empiriques contrôlés, ni même contrôlables au-delà d’une certaine limite ».
Il faut distinguer le mathématicien qui est capable de faire vivre beaucoup de propriétés du modèle et le physicien qui tente de les valider par l’expérience et qui n’y parvient que pour certains d’entre eux. (On peut penser, par exemple, à un modèle de tirage aléatoire des chiffres d’un nombre réel et aux propriétés asymptotiques des décimales qui sont dans la préoccupation du mathématicien, alors que l’expérimentateur n’en étudiera qu’un nombre fini, qu’un échantillon fini observable).
B) « Pourquoi nous ne sommes pas d’accord avec les Étrusques, ou De l’objectivité dans les modèles probabilistes » avec cette splendide citation de Sénèque
» Voici en quoi nous ne sommes pas d’accord avec les Étrusques, spécialistes de l’interprétation des foudres. Selon nous, c’est parce qu’il y a collision des nuages que la foudre fait explosion. Selon eux, il n’y a collision que pour que l’explosion se fasse. Comme ils rapportent tout à la divinité, ils sont persuadés, non pas que les foudres annoncent l’avenir parce qu’elles ont été formées, mais qu’elles se sont formées parce qu’elles doivent annoncer l’avenir. »
Il discute l’opposition entre subjectivistes et objectivistes, sans aller à ce stade jusqu’au développement des probabilités subjectives de Ramsey, de Finetti et Savage, juste pour souligner que les subjectivistes accordent du sens à la probabilité d’un fait unique et non les objectivistes. Mais au lieu de partager : les faits uniques pour les subjectivistes et les faits répétables pour les objectivistes, Matheron veut justement étudier « dans quelle mesure un phénomène unique peut faire l’objet d’une estimation sur la base d’une information fragmentaire ». Ici Matheron a probablement à l’esprit le phénomène des chaînes de Markov : une plante peut se trouver comme elle est à la suite de circonstances au hasard, il n’est reste pas moins vrai que le « comme elle est » resserre les possibilités à venir de cette plante.
Il souligne que « Le modèle, jamais, n’est identique à la réalité. D’innombrables aspects du réel lui échappent toujours, et inversement le modèle contient d’innombrables propositions parasites, sans contrepartie dans la réalité ».
Dire que ce qu’on voit a été tiré au hasard est un non-sens car de ce tirage on ne peut pas reconstruire le triplet de base (Ω, A, P), ni la loi de probabilité qui gouverne ce tirage.
Il attribue à Popper le critère d’objectivité selon lequel l’énoncé a résisté à beaucoup de tentatives d’invalidation, critère que Matheron adopte. Ce critère est dû en fait à John Stuart Mill, et ne concerne que la science nomologique.[4]
« Il n’y a pas de probabilité en soi, écrit-il. Il n’y a que des modèles probabilistes. La seule question qui se pose réellement, dans chaque cas particulier, est celle de savoir si un tel modèle probabiliste, en relation avec un tel phénomène réel, présente ou non un sens objectif. Comme nous l’avons vu, cela revient à se demander si ce modèle est falsifiable ». Matheron est proche de Popper mais plus concret, il ne se place pas en épistémologue, mais en statisticien.
Il décrit quelques modèles probabilistes simples dont le modèle des épreuves répétées, comme le lancement d’un dé. Pour ces modèles discrets, le modèle est réfuté si un événement de probabilité nulle se produit dans la réalité (ou presque nulle si le modèle est complexe).
Pour faire comprendre l’importance du choix des modèles, il prend comme réalité une suite binaire :
00100100001111110110101010001000100001011010001100
Il discute la prévision de la suite sur 10000 tirages, et le travail du statisticien qui fait un modèle d’épreuves répétées i.i.d. (indépendantes identiquement distribuées) avec la probabilité p estimée par la fréquence et l’erreur prise à 2 écarts-types. Le statisticien fait ainsi une hypothèse falsifiable, donc objective.
Mais la « réalité » c’est aussi de savoir ou d’ignorer comment on a obtenu cette suite et si on est en mesure de la prolonger par quel dispositif. Et il fait remarquer que la suite choisie est en binaire les 15 premières décimales de π ; donc sous cet angle, il est facile de la prolonger. D’où un « motif de croire » que c’est le début de π. Et là on touche le problème du rôle de l’interprétation, du sens, on quitte le génotype pour le phénotype.
Il propose de mettre du côté des objectivistes les modèles scientifiques généraux ou panscopiques, et du côté des subjectivistes les modèles pluri- ou monoscopiques destinés à la décision opératoire. Le modèle théorique est réfuté dès qu’un exemple le rejette. « Le modèle monoscopique doit être jugé au seul but qu’il poursuit », Matheron a visiblement en tête l’exemple d’un modèle de sous-sol géologique où l’on s’intéresse à la vertu prédictive du modèle en vue de forages.
C) La forêt poissonnienne
Là apparaît clairement le schéma épistémologique de Matheron.
A propos d’une forêt, d’un gisement minier ou d’une chaine de montagnes, il considère deux situations épistémiques :
- a) l’étude de cette famille d’objets : les forêts, comment sont-elles, etc.
Les gisements de cuivre, leurs structures… c’est l’approche scientifique objective externe avec des modèles pan-scopiques, donc on s’intéresse à l’ensemble des objets d’un même type.
- b) les outils de décision pour la gestion d’un exemple unique : la forêt de Mervent-Vouvant, une mine de cuivre au Chili, etc. « Le mineur doit estimer les différentes parties de son gisement avant de décider lesquelles exploiter, lesquelles laisser en place, comme trop pauvres. » Il s’agit alors de modèles mono-scopiques.
Dans le cas d’une forêt, les arbres sont des points et ils sont répartis selon une mesure poissonienne d’intensité constante sur l’aire considérée. C’est le modèle. Le caractère poissonnien du modèle exprime deux choses concrètes :
- i) la densité moyenne d’arbres à l’hectare ne semble pas présenter de variations systématiques dans l’espace ;
- ii) le fait qu’une zone soit très (ou très peu) fournie en arbres n’implique pas en moyenne qu’une zone voisine soit plus ou moins fournie que les autres. « Il ne s’agit plus du problème classique de la statistique qui consisterait à estimer la densité d’un processus ponctuel de Poisson, mais plutôt du choix d’un modèle adéquat pour une réalité physique donnée ».
Matheron dégage pour cela certaines étapes épistémologiques, et insiste sur le fait que la méthode dépasse la statistique classique ou étroite de tester une hypothèse, parce qu’il y a de l’interprétatif dans le choix de la famille de modèle et cela conditionne l’intérêt prédictif de la méthode. Le talent du géostatisticien réside dans l’art de choisir le modèle le plus prédictif.
D) Le choix et la hiérarchie des modèles
Matheron précise les étapes ainsi dégagées pour le cas général d’une réalité régionalisée, i.e. une fonction z(x) définie dans une zone bornée de R3 ou R4.
Il mentionne la classe importante de modèles des processus spatialement stationnaires (avec une représentation spectrale par un processus à accroissement orthogonaux et une mesure spectrale) et d’autres outils.
Dans toute la suite de son traité, Matheron développe la méthode fondée sur la pratique du centre de Géostatistiques de Fontainebleau, qui est toujours de faire des déductions sur une réalité unique partiellement connue à l’aide d’un modèle probabiliste choisi grâce à des critères d’objectivités internes.[5]
Il explicite un outil technique particulier : le krigeage, qui est entouré d’un certain mystère, longtemps une spécificité du centre de Fontainebleau, qui est une méthode de linéarisation pour approcher une espérance conditionnelle inspirée de papiers de l’ingénieur Danie Krige.
E) Discussion
Quelques remarques pour dégager les points forts de la philosophie de Matheron et les mettre en discussion.
1) Premier point souligné par Matheron : ce n’est pas parce qu’un phénomène unique est irrégulier qu’il doit être pensé comme un tirage aléatoire dans une famille de cas similaires. Exemple la ligne du rivage d’un continent est ce qu’elle est. La côte bretonne est ce qu’elle est, on ne peut dire qu’elle résulte d’un tirage au hasard.
2) Mais Matheron va plus loin : il développe l’idée qu’à partir d’une situation unique les propriétés mêmes de cette situation (critères micro-ergodiques etc.) permettent de choisir un modèle probabiliste qui épouse bien la réalité et duquel on peut tirer des conséquences confrontables à l’expérience. Il explicite des problèmes de répartition spatiale ou dans R4.
3) Il s’ensuit que sa critique véhémente de Monod porte sur le fait que le modèle de la mutation au hasard de Monod est mauvais pour des raisons internes (une molécule ne casse pas au hasard, mais se brise en des points de fragilité dans les circonstances considérées). Le modèle est théorique et non objectif (les acides aminés ne sont pas répartis comme s’ils avaient été tirés au hasard).
4) L’idée fructueuse des critères d’objectivité internes pour étudier une réalité unique comme un gisement, peut-elle s’appliquer au cas de la nature ? L’objectivité externe n’est évidemment pas complètement accessible, nous n’avons pas toutes les natures possibles à disposition. Il faut donc considérer que c’est la nature vivante et physique qui est la réalité unique. Adapter un modèle probabiliste sur une réalité aussi vertigineusement complexe est forcément très grossier.
Ce serait moins utopique pour un écosystème. Mais il faudrait alors qu’on sache pour les espèces étudiées passer du génotype au phénotype même pour les êtres microscopiques et leurs mutants.
5) Dernier point qui se réfère à mes propres travaux : La philosophie de Matheron (telle que rédigée en 1978) ne s’applique qu’à certaines réalités. Ce serait une faute de tenter de l’appliquer à des phénomènes dont l’étrangeté est combinatoire. On commettrait la même faute que si au vu de la répartition statistique des nombres premiers jusqu’à un million on en déduisait par un modèle probabiliste les nombres premiers suivants (cf. Bouleau 2021 et 2022).
La philosophie de Matheron peut être schématisée en :
– d’une part, une critique de l’immersion brutale d’une situation unique comme tirage au hasard. La réalité est ce qu’elle est et le modèle probabiliste ne peut être tiré que d’hypothèses et de compréhension des circonstances ;
– d’autre part, le développement de nouvelles techniques pour extraire de certaines situations déterministes, du hasard qu’elles ont en elles-mêmes. Ceci est exploré surtout pour la géophysique.
Références
P. Agterberg, « Georges Matheron, Founder of Spatial Statistics » Earth sciences history, – Meridian allenpress 2004.
M. Bilodeau, F. Meyer, M. Schmitt, eds, Space, Structure and Randomness, Contributions in Honor of Georges Matheron, Springer 2005.
N. Bouleau, La modélisation critique, Quae 2014.
N. Bouleau, Ce que Nature sait, La révolution combinatoire de la biologie et ses dangers, PUF 2021.
N. Bouleau, La biologie contre l’écologie ? Le nouvel empirisme de synthèse, Spartacus-idh 2022.
N. Bouleau et D. Bourg, Science et prudence, Du réductionnisme et autres erreurs par gros temps écologique, PUF 2022.
A. Jacquard « Hasard et génétique des populations » in Le hasard aujourd’hui, Seuil 1991.
D. Jeulin « Morphology and effective properties of multi-scale random sets: A review » Note CRAS Mécanique, 340, 219-229, 2012.
N. Lind, M. Pandey, J. Nathwani, « Assessing and Affording the Control of Flood Risk » Structural Savety 2009.
G. Matheron, Estimer et choisir, Ecole des Mines de Paris 1978; Estimating and Choosing, Springer 1989.
G. Matheron et J. Serra, « The Birth of Mathematical Morphology » Proc. 6th Intl. Symp. Mathematical Morphology, 2002.
G. Matheron, « Kriging, or Polynomial Interpolation Procedures, a Contribution to polemics in mathematical Geology » Transactions Vol LXX, 240-244, 1967.
J. Monod, Le hasard et la nécessité, Seuil, 1970.
E. Schoffeniels, L’anti-hasard, Gauthier-Villars 1973.
J. Serra « Is pattern Recognition a Physical Science ? » Proc. 15th International Conf. on Pattern Recognition 2000.
René Thom, « Halte au hasard, silence au bruit », Le Débat, n°31, 119-132, Gallimard 1980.
R. Webster, « Is soil variation random ? » Geoderma, 07, 149–163, 2000.
Notes
[1] Le traité de Buffon porte ce titre quoiqu’il s’agisse de probabilités exclusivement, mais elles sont appliquées à la société, aux jugements des hommes, et ce sera encore l’ambition de Condorcet au sujet des préférences électorales.
[2] Monod en effet ne se place pas du tout du point de vue des probabilités subjectives chères aux économistes, développées par de Finetti, Ramsey et Savage au début du 20e siècle.
[3] Voir N. Bouleau La modélisation critique chapitre 5, Quae 2014.
[4] Voir pour « science nomologique », N. Bouleau et D. Bourg, Science et prudence, Paris, Puf, 2022.
[5] Il s’agit de palier le fait que la réalité n’est pas un tirage d’un modèle ergodique. Il faut donc extraire de cette réalité une certaine généricité. Il parle de micro-ergodicité.