Dan Sperber & Gloria Origgi (2005) Pourquoi parler, comment comprendre? In J-M. Hombert, (ed.) L’origine de l’homme, du langage et des langues. (Fayard), 236-253.

“…Une nouvelle branche de la linguistique, la pragmatique, s’est développé au cours des dernières décennies. Elle étudie la compréhension des énoncés en contexte. Qui adopte une perspective pragmatique est amené à concevoir les énoncés non tant comme des moyens qu’utilise le locuteur pour transmettre au moyen de sons le sens qu’il veut communiquer, mais plutôt comme des indices riches et complexes que le locuteur fourni à l’auditeur afin de lui permettre de reconstruire le sens voulu… Nous nous interrogerons ici sur les conséquences de la perspective pragmatique pour l’étude de l’évolution du langage…”

Sperber, Dan & Gloria Origgi
Pourquoi parler, comment comprendre ?
In Jean-Marie Hombert, Ed. L’origine de l’homme, du langage et des langues
Fayard, Paris, 2005. 236-253

Imaginons – grâce à l’une de ces expériences de pensée qu’affectionnent les philosophes – un extra-terrestre intelligent connaissant intégralement la grammaire d’une langue humaine comme le français, et sachant donc associer aux sons de toute phrase sa signification linguistique. Cette connaissance de la langue lui suffirait-elle à comprendre ce que veut dire Jeanne quand elle énonce : « il était trop petit »? La connaissance de la langue ne lui permettrait certes, pas de reconnaître les éventuels sous-entendus de cet énoncé, mais notre extra-terrestre comprendrait-il, au moins, ce que Jeanne affirme expressément? Il s’en faut de beaucoup. Comment, en effet, pourrait-il savoir à qui ou a quoi se réfère le pronom « il », à quel moment du passé renvoie l’imparfait du verbe être, et de quel point de vue « il » était « trop petit » ? Jeanne pourrait énoncer « il était trop petit » pour expliquer que son fils Léo était trop petit l’année dernière pour entrer en maternelle, que le sapin acheté par Robert pour Noël était trop petit à son goût, que le Liechtenstein avait été, avant 1990, considéré trop petit pour avoir un siège aux Nations Unies, ou une indéfinie variété d’autre messages.

La grammaire d’une langue – même au sens large de « grammaire » incluant non seulement la syntaxe, mais aussi la phonologie et la sémantique – n’en fournit pas le mode d’emploi et ne permet pas, à elle seule, de comprendre les énoncés. Les êtres humains, à la différence de notre extra-terrestre, sont capables non seulement d’associer aux sons d’une phrase une signification linguistique, mais aussi de se servir d’informations sur la situation dans laquelle ils se trouvent, les interlocuteurs, leurs interactions passées et la culture qu’ils partagent pour interpréter des énoncés qui, sinon, demeureraient comme des bribes de sens sans portée définie.

Une nouvelle branche de la linguistique, la pragmatique, s’est développé au cours des dernières décennies. Elle étudie la compréhension des énoncés en contexte. Qui adopte une perspective pragmatique est amené à concevoir les énoncés non tant comme des moyens qu’utilise le locuteur pour transmettre au moyen de sons le sens qu’il veut communiquer, mais plutôt comme des indices riches et complexes que le locuteur fourni à l’auditeur afin de lui permettre de reconstruire le sens voulu. Nous sommes ainsi amené à repenser le rôle exact de la langue dans la communication linguistique. Ce réexamen engendre des conséquences pour d’autres branches de la linguistique (en particulier la sémantique). Nous nous interrogerons ici sur les conséquences de la perspective pragmatique pour l’étude de l’évolution du langage. Nous montrerons que la faculté de langage propre aux être humains n’a pu évoluer dans l’histoire de l’espèce qu’en liaison avec une capacité pragmatique plus générale.

Évolution et fonctions du langage et des langues

Nous tiendrons pour acquises deux thèses sur l’évolution du langage. Selon la première, la faculté de langage, c’est-à-dire la faculté qu’a tout enfant d’apprendre une langue humaine, résulte de l’évolution biologique de l’espèce. En revanche, si l’on conçoit le langage comme un phénomène purement culturel sans base biologique propre, alors il n’y a pas lieu de s’interroger sur l’évolution biologique de la faculté de langage. Selon la seconde hypothèse, non seulement la faculté de langage est un mécanisme biologique mais, elle découle en outre de la sélection naturelle (plutôt que d’autres forces à l’œuvre dans l’évolution biologique, comme la dérive génétique). Si l’on refuse cette seconde thèse (comme le fait Piattelli-Palmarini 1989), l’évolution biologique du langage est et restera sans doute un mystère et non un problème qu’il est raisonnable d’espérer élucider. Les théories de l’évolution biologique du langage tiennent généralement ces deux thèses pour acquises. En d’autres termes, elles conçoivent la faculté de langage comme une adaptation au sens biologique du terme, c’est-à-dire comme un trait qui doit son existence à sa fonction.

Pour comprendre l’émergence d’une adaptation particulière, il faut en comprendre la fonction (ou les fonctions). La notion biologique de fonction a fait l’objet de diverses analyses nouvelles au cours des dernières décennies (Millikan, 1984 ; Allen, Bekoff & Lauder, 1998). Sans entrer dans le détail, nous retiendrons l’idée générale selon laquelle la fonction d’un trait biologique est un effet de ce trait qui aura contribué au succès reproductif des organismes qui en sont dotés.

Tout trait biologique produit des effets divers. Le cœur, par exemple, génère, entre autres effets, ceux d’alourdir le corps, de faire du bruit, et de pomper le sang. Seul ce dernier effet contribue au succès reproductif des organismes dotés d’un cœur, et en constitue donc la fonction. Pour prendre un exemple cette fois-ci comportemental, le cri d’alarme du singe vervet apercevant un guépard a, entre autres, deux effets remarquables : celui d’attirer l’attention du guépard sur l’individu qui l’émet et celui d’accroître les chances de ses congénères d’échapper au prédateur. Le premier de ces effets, qui compromet les chances de survie et donc de reproduction du singe altruiste semble mettre en question l’idée même que son cri d’alarme puisse être une adaptation au sens darwinien du terme. Cependant, la disposition à pousser un cri d’alarme face à un prédateur, si elle expose l’individu qui l’émet, protège en revanche ses proches, également porteurs du trait, et accroît donc, en moyenne, le succès reproductif des individus porteurs du trait. Conformément à la règle de William Hamilton (Hamilton, 1964), cette disposition à pousser un cri d’alarme, nuisible pour celui qui l’émet mais bénéfique pour ses proches, sera donc sélectionnée. La fonction ainsi conçue représente un facteur causal expliquant la récurrence du trait à travers les générations.

Quelle est donc la fonction, ou quelles sont les fonctions, au sens que nous venons de caractériser, de la faculté de langage ? A cette question, diverses réponses ont été proposées au cours de ces dernières années. Ainsi Bernard Victorri ( Victorri, 1999 ; lire le chapitre 8.1) affirme-t-il que la fonction narrative serait à la base de l’émergence du langage. De son côté Robin Dunbar voit dans le renforcement des liens sociaux à travers la transmission des rumeurs le facteur causal responsable de l’évolution du langage (Dunbar, 1996). Enfin Jean-Louis Dessalles, pose l’hypothèse que l’évolution du langage est liée à l’organisation politique des groupes humains et permet en particulier la formation de coalitions (Dessalles, 2000). Quels que soient leurs mérites, ces différentes thèses ont en commun de mettre en avant un ou plusieurs effets adaptatifs de la communication linguistique. Or la communication linguistique elle-même est un effet non pas direct mais indirect de la faculté de langage. Les effets de cette communication linguistique sont donc des effets encore plus indirects de la faculté de langage.

La faculté de langage, en effet, (si on la conçoit comme un trait biologique et non comme une abstraction) sert non pas à communiquer mais à apprendre une langue. La maîtrise d’une langue, jointes à des compétences cognitives et sociales particulières, permet, quant à elle, la communication linguistique (et plus généralement l’expression des pensées, qu’elle soit à des fins communicatives ou non, mais nous laisserons de côté ici les fonctions non communicatives du langage). La communication linguistique à son tour peut servir à coordonner les actions des interlocuteurs, à manipuler autrui, à partager savoirs et savoir-faire à l’échelle du groupe, etc. Il y a donc un enchaînement d’effets potentiellement adaptatifs que l’on peut représenter ainsi:

Faculté de langage

Acquisition d’une langue

Maîtrise d’une langue Autres compétences cognitives et communicatives

Communication linguistique

Effets adaptatifs divers de la communication

Le débat actuel sur la fonction de la faculté de langage, qui cherche à expliquer cette dernière par tels ou tels effets de la communication linguistique, saute par-dessus plusieurs étapes nécessaires de l’explication. C’est un peu comme si l’on envisageait d’expliquer l’évolution des organes de locomotion d’une espèce donnée en leur attribuant comme fonction de permettre aux individus qui en sont dotés de rechercher leur nourriture, d’échapper aux prédateurs, de déplacer leur habitat, ou d’optimiser leur choix de partenaires sexuels. Aussi pertinente que soient chacune de ces hypothèses, la fonction première des organes de locomotion d’une espèce n’en demeure pas moins de permettre à ses membres de se déplacer d’une façon particulière (par le vol, la marche, la reptation, la nage, etc.) dans leur milieu. S’il s’agit d’expliquer non seulement pourquoi il leur est avantageux de pouvoir se déplacer, mais aussi, et d’abord, pourquoi il leur est avantageux de se déplacer de la manière dont ils le font, c’est par cette fonction première qu’il faut commencer. Dire que la fonction première d’organes de locomotion est la locomotion peut sembler par trop trivial, mais il n’en va plus de même dès qu’on s’intéresse au mode précis de cette locomotion. De même, dire que la fonction première de la faculté de langage est de permettre l’acquisition d’une langue et que la fonction première de la maîtrise d’une langue est faciliter la communication linguistique n’est plus trivial dès lors qu’on se demande comment s’effectuent cette acquisition et cette communication.

Il se trouve que, tant du point de vue de leur forme, de leur acquisition, et de leur utilisation dans la communication, les langues humaines diffèrent radicalement des autres codes de la communication animale.

Dans le sens où nous employons le terme, un code est un ensemble d’associations entre, à chaque fois, un message et un signal. Un message est un contenu qu’un individu peut vouloir communiquer à un autre. Un signal est une forme perceptible produite par le communicateur et perçue par le destinataire. Un individu peut transmettre un message à un autre individu avec lequel il partage le même code en encodant ce message au moyen du signal que le code associe à ce message, signal que le destinataire décodera pour retrouver le message initial. Un code rudimentaire, comme par exemple les cris d’alarme des singes vervet, peut consister en une simple liste d’associations message-signal indépendantes les unes des autres : un cri pour prévenir de la présence d’un serpent, un autre pour prévenir de la présence d’un guépard, un troisième pour prévenir de la présence d’un rapace. Dans un code un peu plus élaboré, des variantes d’un même signal peuvent correspondre à des variations du message. Ainsi la plus ou moins grande rapidité des mouvements au moyen desquels une abeille indique à ses congénères où trouver du pollen indique-t-elle la plus ou moins grande distance à laquelle la ressource est située. Dans le cas des langues humaines, l’ensemble de ces associations message-signal que sont les phrases s’avère illimité et ne peut donc pas être représenté sous la forme d’une simple liste d’associations message-signal, même avec variations pour chaque association. Comme l’a soutenu Noam Chomsky – et cet aspect de sa conception de la grammaire est le moins contesté –, le code linguistique doit être représenté sous la forme d’une grammaire finie qui, avec des moyens limités, engendre une infinité de phrases.

Les codes de la communication animale tels que celui des singes vervet ou celui des abeilles sont en général transmis génétiquement. Pour leur part, les langues humaines font l’objet d’un processus d’acquisition qui s’étend sur plusieurs années. Même si on accepte les conceptions les plus innéistes de la faculté de langage selon lesquelles l’acquisition de la syntaxe n’est pas un apprentissage au sens habituel du terme, mais consiste seulement à fixer les valeurs que prennent pour une langue donnée quelques paramètres donnés d’avance, il n’en demeure pas moins que le lexique des langues humaines, immense répertoire de cas particuliers, doit bien être appris, élément par élément.

Le fait que la langue et en particulier le lexique doivent être acquis pose un problème en termes d’évolution. Pourquoi en va-t-il ainsi ? Pourquoi n’était-il pas plus avantageux de fixer la langue elle-même plutôt qu’une faculté d’acquisition des langues dans le génome ? John Tooby et Leda Cosmides (1990) répondent que la quantité d’information linguistique et en particulier lexicale qui peut être stockée dans l’environnement social est bien plus grande que celle qui peut être stockée dans le génome. Grâce au fait qu’elles font l’objet d’un apprentissage, les langues humaines peuvent être d’une richesse sans équivalent dans la communication animale. Nous proposerons ci-dessous un autre élément de réponse : pour qu’une disposition génétique à émettre un nouveau signal soit adaptative et puisse donc être sélectionnée, il faut un ensemble de conditions rarement rassemblées, d’où le très faible nombre de signaux stabilisés par la sélection naturelle dans une même espèce.

Les langues humaines s’avèrent incomparablement plus riches que les codes que d’autres espèces utilisent pour communiquer. Malgré cette richesse – ou peut être à cause d’elle – les langues humaines sont des codes grossièrement défectueux ! Pour permettre la communication par codage et décodage, il ne suffit pas en effet que communicateur et destinataire partagent le même code : il faut que ce code associe à chaque message à communiquer au moins un signe (simple ou complexe) et à chaque signal au plus une interprétation. Il faut, en d’autres termes, que le code soit assez riche pour que tout ce qui peut devoir être communiqué puisse être encodé et qu’il soit assez limité pour que tout ce qui est encodé puisse être décodé. Les signaux ambigus ne sont acceptables que s’ils peuvent être automatiquement rendus compréhensibles en fonction de facteurs contextuels prédéterminés (comme l’est par exemple la danse des abeilles en fonction de la position du soleil dans le ciel au moment de la danse). Or, comme on l’a vu avec le commentaire de Jeanne « il était trop petit », les phrases des langues humaines sont typiquement compatibles avec un éventail ouvert d’interprétations.

Comme aiment à l’affirmer les pragmaticiens, les phrases « sous-déterminent » massivement leur interprétation. D’une part les énoncés comportent des ambiguïtés de sens et des indéterminations référentielles (par exemple des pronoms dont le référent n’est pas linguistiquement déterminé), ambiguïtés et indéterminations dont la résolution fait appel à des processus non pas de décodage mais d’inférence. D’autre part les phrases servent typiquement à communiquer plus de sens qu’elles n’en transmettent, soit parce que le locuteur s’exprime elliptiquement, soit parce que, de toute façon, une partie de ce qu’il veut communiquer peut être suggéré, mais pas vraiment encodé dans la langue. Les métaphores, dont la paraphrase littérale n’épuise pas le sens, en sont l’exemple le plus évident, même si le phénomène est bien plus général. Ainsi, quand Homère parle de « l’aurore aux doigts de rose », mieux on comprend ce qu’il veut dire, moins on serait à même d’exprimer exactement la même idée de façon littérale.

Ce caractère apparemment défectueux des langues en tant que codes est, en partie au moins, lié au fait qu’elles font l’objet d’un apprentissage. Cet apprentissage entraîne une importante variabilité interindividuelle, et de cette variabilité résultent, à l’échelle historique, ambiguïtés et polysémies. Dire dans ces conditions que la fonction (sinon unique, au moins principale) d’une langue est de permettre la communication cesse d’être une trivialité : comment les langues permettent-elles la communication en dépit de leur caractère de code grossièrement imparfait ? Quelles pressions sélectives ont-elles pu s’exercer pour que les langues humaines aient cette double propriété de richesse sémantique et de défectuosité en tant que code ?

Deux conceptions de la communication linguistique

En simplifiant, deux modèles de la communication linguistique s’opposent : le modèle classique de la communication ou «modèle du code» et le modèle inférentiel. Selon le modèle du code (qui s’applique bien à la communication animale), un message peut d’être communiqué dans l’exacte mesure où il peut être encodé au moyen d’un signal par le communicateur et décodé par le destinataire. Appliqué au cas des langues humaines, le modèle du code revient à dire que les phrases de la langue sont des signaux complexes qui permettent de représenter et de transmettre les messages, eux aussi complexes, que les humains sont capables d’échanger entre eux. Ce modèle classique n’est guère compatible avec le fait que les langues humaines possèdent, comme on l’a vu, des codes très défectueux.

Selon le modèle inférentiel, dont différentes versions sont développées dans la pragmatique contemporaine (voir par exemple Carston 2002, Ducrot 1984, Grice 1989, Levinson 1983, 2000, Recanati 2004, Sperber et Wilson 1989), un énoncé donne un sens linguistique qui ne correspond que de façon incomplète et généralement approximative au message du locuteur. Le décodage de ce sens linguistique n’est qu’un élément du processus de compréhension. Ce processus, généralement automatique et inconscient, est d’abord et avant tout un processus d’inférence qui partant d’indices aboutit à une conclusion sur le sens voulu par le locuteur. Ces indices sont d’une part l’énoncé lui-même et d’autre part un ensemble d’informations contextuelles. Ainsi, quand Jeanne revient de la pêche, le panier vide, Robert l’interroge :

Robert : Tu n’as rien attrapé ?

Jeanne : Si, un gardon.

Robert : Où est il ?

Jeanne : Il était trop petit.

Décodant la phrase dans ce contexte, Robert en infère automatiquement qu’ « il » désigne le gardon, que l’imparfait du verbe être renvoie au moment où ce gardon a été péché, et que « trop petit » fait allusion à la taille minimale en dessous de laquelle un poisson doit être remis à l’eau. En affirmant « il était trop petit », Jeanne a fourni un indice tout à fait suffisant à Robert pour qu’il puisse comprendre ce qu’elle souhaitait communiquer.

Un singe vervet entendant un signal d’alarme ou une abeille suivant la danse d’une autre abeille a pour objectif de comprendre le signal, et non pas les états mentaux du congénère qui l’émet. Lorsque les humains communiquent, en revanche, il ne leur suffit pas de comprendre ce que signifient les paroles prononcées. Ils doivent comprendre ce que voulait exprimer le locuteur en les prononçant. Autrement dit, pas de communication verbale, pas de compréhension, sans attention portée aux intentions du communicateur.

La communication ainsi conçue relève de la capacité qu’ont les êtres humains d’attribuer des états mentaux à autrui, autrement dit de leur psychologie naïve ou spontanée. Cette capacité a fait l’objet de nombreux travaux en psychologie du développement (Baron-Cohen et al., 2000) et dans l’étude de l’évolution des comportements sociaux (Byrne et Whiten, 1988). Les humains interprètent spontanément le comportement des autres non pas comme de simples mouvements corporels, mais comme la réalisation d’intentions guidées par des états mentaux, désirs et croyances.

Vivant dans un monde habité non seulement par des objets inertes et des corps vivants mais aussi par des états mentaux, les humains peuvent vouloir agir sur ces états mentaux. Ils peuvent chercher à modifier les désirs et les croyances d’autrui. Tout acte visant à faire évoluer les états mentaux d’autrui n’est pas pour autant un acte de communication.

Jeanne et Robert participent à une soirée. Ce dernier veut faire comprendre à Jeanne qu’il est fatigué et désire rentrer à la maison. Pour cela, il pourrait simplement donner l’occasion à Jeanne de constater qu’il est fatigué, par exemple en ne retenant pas ses bâillements, escomptant que celle-ci sa compagne en tirera la conclusion voulue. Il ne s’agirait pas, dans ce cas, de communication au sens où nous entendons le terme. Robert pourrait aussi regarder Jeanne dans les yeux et soit mimer un bâillement, soit exagérer un bâillement naturel. Dans ce cas, son comportement serait bien une façon de communiquer à Jeanne qu’il est fatigué. Il pourrait aussi communiquer verbalement et prononcer les paroles « je suis fatigué ». Quand Robert communique véritablement, il le fait en montrant à Jeanne qu’il cherche à lui faire comprendre quelque chose, et en lui donnant des indices, par ses gestes ou ses paroles, de ce qu’il veut qu’elle saisisse. Il suscite en elle le désir de le comprendre et l’aide à y parvenir. La communication ainsi entendue est une façon élaborée d’agir ouvertement sur les états mentaux d’autrui.

C’est, le philosophe Paul Grice (1957) qui a posé les bases de cette conception inférentielle de la communication humaine. Il a analysé en effet de façon nouvelle les rapports entre sens linguistique (sentence meaning) et «vouloir-dire» ou sens voulu (speaker’s meaning). Le sens voulu, dans l’analyse que Grice en propose, est une intention complexe du communicateur qui doit être reconnue par le destinataire pour pouvoir s’accomplir, c’est une intention proprement communicative. C’est bien ce que Robert réalise quand il indique à Jeanne, par ses gestes ou ses paroles, à la fois qu’il a l’intention de lui faire comprendre quelque chose et ce qu’il a l’intention de lui faire comprendre. Le sens linguistique n’est ici qu’un moyen de contribuer à indiquer le sens voulu.

Dans la communication inférentielle le communicateur cherche donc à réaliser son intention en la rendant manifeste au destinataire. Une telle procédure comporte un risque évident : le destinataire, comprenant qu’on cherche à l’influencer, peut facilement déjouer cette intention. En revanche, la communication inférentielle, du fait même qu’elle est ouverte, comporte deux avantages qui la rendent, dans la plupart des cas, bien plus puissante que toutes les autres façons d’agir sur les états mentaux d’autrui. En effet, si un destinataire méfiant refusera de se laisser influencer, un destinataire ayant confiance en la compétence et en l’honnêteté du communicateur fera de lui-même un effort pour comprendre un message qu’il sera disposé à accepter (cf. Sperber 1994). Plus important encore, tandis que la manipulation des états mentaux d’autrui par des moyens non communicationnels est relativement lourde à mettre en œuvre et demeure toujours imprécise, la communication ouverte permet de véhiculer à très peu de frais des contenus aussi riches qu’on le désire.

Le rôle du langage, dans la communication inférentielle est justement de fournir au communicateur des indices aussi précis et complexes que possible du contenu qu’il veut faire accepter par le destinataire. Il n’est pas nécessaire pour cela que l’énoncé encode ce contenu in extenso et sans ambiguïté. De façon tout à fait ordinaire, un encodage fragmentaire, ambigu et imprécis suffit, dans le contexte, à indiquer un sens complet et univoque. La compréhension inférentielle n’est pas, à cet égard, différente des autres processus cognitifs d’inférence, qui tirent des conclusions assez fiables d’indices fragmentaires et ouverts à plusieurs interprétations en s’appuyant sur des régularités empiriques et sur le contexte : de son odeur, on infère qu’un melon est mûr ; de volets fermés, on déduit que les habitants sont absents. La tâche principale de la pragmatique est d’expliquer comment s’effectue un tel processus d’inférence dans le cas particulier de la communication linguistique. Quelles régularités empiriques guide le processus ? Comment les propriétés linguistiques de l’énoncé d’une part, et les informations contextuelles d’autre part sont-elles exploitées ? Si différentes théories pragmatiques donnent des réponses différentes à ces questions, elles s’accordent en revanche sur les deux considérations fondatrices de toute leur démarche : la compréhension est inférentielle, et elle vise, en s’appuyant sur le sens linguistique de la phrase et sur le contexte, à découvrir le sens voulu par le locuteur.

Le modèle classique du code et le modèle inférentiel développé par la pragmatique contemporaine assignent, on le voit, des fonctions différentes au langage dans la communication linguistique. À des fonctions différentes devraient correspondre, dans l’histoire de l’espèce, des pressions sélectives elles aussi différentes et donc des hypothèses distinctes sur l’évolution biologique du langage. Cependant, comme nous l’avons noté, soit qu’en pratique ils acceptent le modèle du code (comme par exemple Pinker, 1994, ch.7), soit qu’ils envisagent l’évolution du langage sans se soucier de ses propriétés proprement linguistiques (comme par exemple Dunbar 1996), les théoriciens de l’évolution du langage n’ont pas donné de place significative à la dimension pragmatique du langage (Dessalles faisant à cet égard exception) et ont encore moins pris en considération le rôle précis des processus communicationnels dans la communication linguistique.

Avant de montrer comment la prise en considération de la dimension pragmatique et inférentielle de l’usage du langage peut inspirer la réflexion sur son évolution, nous mettrons en évidence un aspect paradoxal de cette évolution. Le traitement de ce paradoxe peut servir de pierre de touche pour évaluer différentes hypothèses sur l’évolution de la faculté de langage, et en particulier pour contraster les hypothèses qui présupposent le modèle du code et celles qui partent d’un modèle inférentiel.

Un aspect paradoxal de l’évolution du langage

La plupart des capacités cognitives spécialisées d’une espèce possèdent un domaine spécifique d’informations disponibles dans l’environnement avant que la capacité n’émerge et n’évolue. Il s’agit d’adaptations à cet aspect de l’environnement. Par exemple la perception des couleurs est une adaptation tirant parti des différences de fréquence des radiations électromagnétiques dans le spectre visible ; ces différences existent indépendamment de tout mécanisme de perception. La reconnaissance des visages constitue, elle aussi, une adaptation à un type d’information présent dans l’environnement avant que la capacité n’ait évolué. Cependant, dans ce second cas, le fait que les visages soient reconnus aura entraîné une évolution des visages eux-mêmes dont l’aspect, plus ou moins attirant ou intimidant, pouvait désormais comporter des avantages ou des inconvénients sélectifs, avec, sans doute, une co-évolution de la reconnaissance des visages et des visages eux-mêmes.

D’autres capacités cognitives, plus rares, représentent des adaptations à un aspect de l’environnement – typiquement de l’environnement social – lui-même étant l’effet de la présence de ces capacités cognitives dans l’espèce. Initialement vide, leur domaine d’informations ne sera rempli que par le comportement d’individus déjà dotés de la capacité en question. C’est le cas par exemple d’une disposition à entrer dans des échanges réciproques : alors qu’une capacité de reconnaître les visages aura pu contribuer au succès reproductif du premier mutant qui en en a été doté, une disposition à échanger aura sans doute été plutôt nuisible ou au mieux neutre pour un individu ne trouvant autour de lui aucun autre individu pareillement disposé. Il en va de même d’une disposition à communiquer au moyen de signaux : par exemple la disposition des lucioles mâles à émettre un signal lumineux pour attirer les femelles n’est adaptative que dans une espèce ou les femelles ont la disposition complémentaire à s’approcher des mâles émettant de tels signaux. Autrement le signal lumineux n’aurait pour seul effet, anti-adaptatif cette fois, que d’attirer les prédateurs.

L’évolution initiale de toutes ces dispositions sociales qui ne deviennent adaptatives qu’à partir du moment où elles sont suffisamment répandues pose un problème évident. Le trait devra persister et se répandre pendant plusieurs générations avant de pouvoir remplir sa fonction sociale. Ce genre de problème n’est bien sûr pas insoluble : cette disposition peut avoir été neutre avant de devenir adaptative ou aura pu être génétiquement associé à d’autres effets immédiatement adaptatifs.

Le fait que l’évolution de la faculté de langage pose un problème de ce type a déjà été noté. Norman Geshwind écrivait par exemple : «… une mutation permettant aux humains de produire verbalement un signal ne peut être avantageuse que s’il y a un mécanisme pour comprendre ce signal chez d’autres humains. On rencontre ici un problème ; l’apparition d’un système pour produire le langage serait inefficace, car les autres humains ne le comprendraient pas. Inversement, l’émergence dans l’évolution d’un système pour comprendre le langage ne serait pas efficace, car il n’y aurait pas d’autres humains pour le produire» (Geshwind, 1980, pp. 312-313). Steven Pinker et Paul Bloom (1990) formulent la question en des termes similaires. Cette façon de poser le problème méconnaît cependant la forme particulièrement complexe qu’il prend dans le cas du langage. En effet la faculté de langage ne représente pas, de toute façon, un système pour produire ou pour comprendre le langage, mais bien pour apprendre une langue. Or à quoi aurait bien pu servir une telle capacité dans un environnement social sans langue à apprendre ? Sans langue dans l’environnement, la faculté de langage n’est pas adaptative. Sans faculté de langage, il paraît difficile de comprendre comment les langues ont pu émerger.

La première solution qui vient alors à l’esprit est de diviser le problème en posant l’hypothèse que la faculté de langage a émergé par étapes, et que les langues qu’elle a permis d’apprendre ont crût en complexité. Cependant, si le problème change alors d’échelle, il ne change pas de nature. Quels facteurs pourraient favoriser une mutation dont l’effet serait de rendre les mutants capables d’apprendre une langue plus complexe qu’aucune des langues parlées dans l’espèce ? Sans langues correspondant à cette faculté de langage plus puissante, la mutation ne semble pas avantageuse. Sans la généralisation de cette mutation, il s’avère difficile de comprendre comment des langues plus complexes ont pu émerger.

Ce problème, on va le voir maintenant, devient particulièrement difficile à résoudre si l’on adopte le modèle de code de la communication linguistique. En revanche, vu sous l’angle du modèle inférentiel, il perd son aspect paradoxal.

L’évolution du langage et les deux modèles de la communication linguistique

La communication codée fonctionne au mieux quand les interlocuteurs partagent exactement le même code. Toute différence entre le code du communicateur et celui du destinataire entraînera en revanche un risque d’erreur possible au cours du processus de la communication. Dans ces conditions, une modification de la faculté de langage d’un individu, si elle n’est pas sans effet sur le code appris, contribuera à l’intériorisation d’un code différent de celui d’autrui à partir des mêmes données linguistiques. Cette non-correspondance des codes nuira à la capacité de l’individu de communiquer. Elle sera anti-adaptative. Le modèle du code est donc particulièrement peu apte à résoudre le paradoxe évoqué dans la section précédente.

Plus généralement, puisque pour constituer un avantage, un code doit être partagé par une population, l’évolution ne peut pas facilement «expérimenter» avec des modifications dont les chances, de toute façon faibles, d’être avantageuses ne se vérifieront que lorsque la modification sera suffisamment répandue. Les ajouts au code de nouveaux signaux (par exemple d’un signal d’alarme pour une nouvelle espèce de prédateurs dans l’environnement), ajouts qui ne modifient pas la structure du code préexistant, semblent les modifications les plus plausibles. La taille très modeste des codes de la communication animale suggère que ces ajouts eux-mêmes sont rares. De fait, les codes de la communication animale, qui, à la différence des langues humaines, fonctionnent vraiment selon le modèle du code, sont typiquement petits et présentent une grande stabilité à l’intérieur d’une espèce donnée. La grande majorité d’entre eux n’implique aucun apprentissage, et lorsque apprentissage il y a, comme dans le cas des oiseaux chanteurs, il ne porte que sur un seul signal forcément appris puisqu’il a pour fonction de distinguer des populations locales de la même espèce.

Dans le cas de la communication inférentielle, les choses se présentent tout autrement. En effet, le succès de la communication inférentielle ne requiert pas que le communicateur et le destinataire aient la même représentation sémantique de l’énoncé. Il suffit qu’ils voient dans l’énoncé, quelle que soit la façon dont ils se le représentent, un indice menant à la même conclusion. Soit par exemple le dialogue banal suivant:

Robert: Je suis crevé !

Jeanne: Eh bien, rentrons à la maison !

Peu importe que le sens auquel Robert et Jeanne associent le mot «crevé» soit le même. Il se peut que, pour Robert, «crevé» signifie une fatigue extrême, tandis que, pour Jeanne, «crevé» sera simple synonyme de «fatigué». De toute façon, Robert lance «je suis crevé» non pour indiquer un degré de fatigue auquel ce terme renverrait, mais pour indiquer contextuellement à la fois sont souhait de rentrer à la maison et la raison de ce souhait, à savoir sa fatigue. Le degré de fatigue qui justifie qu’on désire rentrer chez soi dépend des situations : il n’est pas le même à une soirée entre amis, en promenade, ou lors d’une réunion professionnelle. Dans l’énoncé de Robert, donc, «crevé» indique le degré de fatigue qui, dans la situation d’énonciation, est pertinent en ceci qu’il justifie le souhait de Robert.

Si l’identité de code entre les interlocuteurs n’est pas nécessaire; elle n’est pas davantage suffisante. Soit le dialogue suivant :

Robert: Pouvez vous réparer ma montre ?

L’horloger: Cela prendra du temps.

La sémantique de «prendra du temps» est triviale : prend du temps tout ce qui a une durée non nulle. Si on s’en tient au sens littéral de son énoncé, l’horloger énonce donc un truisme. Cependant, ce faisant, l’horloger met Robert sur la voie d’une interprétation pertinente. C’est bien de temps qu’il s’agit et la réparation de la montre prendra un temps sur lequel il est pertinent d’attirer l’attention de Robert. Si Robert s’attend à une réparation d’au moins une semaine, il comprendra «Cela prendra du temps» comme voulant dire que la réparation prendra plusieurs semaines. Si l’horloger pour sa part pense que Robert s’attend à une réparation le jour même, il se sera exprimé comme il l’a fait pour dire que la réparation sera une affaire non d’heures mais de jours. Que, dans leurs lexiques, les mots «prendre» «du» et «temps» aient le même sens ne protège donc pas Robert et l’horloger du malentendu.

Selon le modèle inférentiel la quasi-identité de code entre interlocuteurs n’est pas nécessaire pour qu’ils puissent communiquer au mieux. Dans ces conditions, le fait qu’une mutation affectant la faculté de langage puisse faire diverger la grammaire du mutant de celle de ses congénères ne nuit pas forcément à sa capacité de communiquer. Comme nous allons le montrer maintenant, une telle mutation peut même s’avérer avantageuse.

Imaginons une protolangue ne comportant que des associations son-sens à l’échelle du mot, sans aucune structure syntaxique. Le mot «boire» dans cette protolangue désigne l’action de boire et rien de plus. Il ne s’agit pas contrairement au «boire» du français de ce que les logicien appellent un « prédicat à deux places », c’est-à-dire, un terme qui en appelle deux autres nommés « arguments » (dans ce cas, les arguments sont le sujet et l’objet direct). Le mot «eau» dans cette protolangue désigne la substance et ne fait rien de plus, ce n’est pas un argument qui appellerait un prédicat. Avec un code aussi limité, le seul décodage par l’auditeur du sens associé au mot prononcé par le locuteur ne suffirait pas assurer de communication entre eux. L’interlocuteur qui associe à l’énoncé «eau» le concept d’eau n’est pas pour autant informé de quoi que ce soit. Même l’énonciation à la suite l’une de l’autre de deux expressions d’un tel langage, comme par exemple «boire»-«eau» ne serait pas entendue comme nous aurions tendance à le faire spontanément sur la base de notre compréhension du français. «Boire»-«eau» ne désigne pas, dans cette protolangue, l’action de boire de l’eau. Nous avons seulement deux concepts, celui de boire et celui d’eau, activés sans être sémantiquement liés. L’activation mentale d’un ou plusieurs concepts sans lien syntaxique entre eux ne désigne pas un état de chose ou une action associant ces deux concepts; encore moins exprime-t-elle une croyance ou un désir.

Dans ces conditions, une telle protolangue n’aurait d’utilité que pour des êtres capables de communication inférentielle. À ceux-là, l’activation par décodage ne serait-ce que d’un seul concept pourrait facilement fournir un indice suffisant pour reconstruire un sens complet voulu par le locuteur. Imaginez deux locuteurs de cette protolangue, Robert et Jeanne, marchant dans le désert. Robert montre du doigt l’horizon et dit «eau». Jeanne en infère correctement qu’il veut dire quelque chose comme il y a de l’eau là-bas. Juste quand ils parviennent au point d’eau, Robert s’effondre épuisé et dit «eau». Ce que Jeanne interprète comme donne moi de l’eau. Les signaux de la communication animale, communication qui, elle, est pleinement codée, ne permettent jamais un tel éventail de constructions interprétatives.

Imaginons maintenant que Jeanne ait été une mutante dont la faculté de langage, plus complexe que celle de ses congénères, l’ait disposée, enfant, à analyser les mots de la protolangue qu’elle était en train d’acquérir soit comme des arguments, soit comme des prédicats à une ou deux places. Elle avait ainsi catégorisé «boire» comme un prédicat à deux places, «eau» comme un argument, etc. Quand Jeanne la mutante entend Robert assoiffé murmurer «eau», ce qui est activé dans son esprit, ce n’est pas seulement le concept d’eau, mais une structure syntaxique avec une place pour un prédicat capable de prendre « eau » comme argument. Son décodage va donc au-delà de ce qui a, en fait, été transmis par Robert. Lui n’est pas un mutant et il s’exprime donc dans la langue rudimentaire de leur communauté, sans y ajouter mentalement de structure syntaxique sous-jacente. Cette non-correspondance entre les représentations que Robert et Jeanne se font de l’énoncé, ne nuit cependant pas à leur communication. Même si elle n’avait pas été une mutante, Jeanne aurait du, pour comprendre ce que voulait dire Robert, se représenter mentalement (mais pas linguistiquement) non seulement l’eau mais l’action qui avait l’eau pour objet. Jeanne la mutante est d’emblée mise sur la voie grâce à la structure syntaxique qu’elle attribue, faussement mais utilement, à l’énoncé de Robert.

Quand elle parle, Jeanne la mutante transmet au moyen de signaux homonymes avec ceux de sa communauté, non seulement des concepts atomiques, mais des structures prédicat-arguments. Quand elle prononce «eau», son énoncé encode une structure syntaxique où devrait prendre place un prédicat dont «eau» serait l’argument. Quand elle dit «boire», son énoncé encode une structure syntaxique où devraient prendre place les deux arguments (sujet et objet) de «boire». Quand elle dit «boire eau», son énoncé encode non seulement les deux concepts boire et eau mais aussi le concept complexe boire de l’eau (plus la position non-exprimée de l’argument sujet de «boire»). Les interlocuteurs de Jeanne ne reconnaissent pas ces structures sous-jacentes dans ses énoncés, mais ils aboutissent tout de même aux interprétations voulues, même s’ils le font par un chemin inférentiel moins bien préparé linguistiquement.

Maintenant, si Jeanne est une mutante de la deuxième génération et compte donc parmi ses interlocuteurs des frères et sœurs, eux aussi mutants qui parlent et comprennent la même chose qu’elle, alors elle et ses co-mutants communiqueront plus efficacement que les autres membres de leur communauté. Il entrent en effet en relation au moyen d’une langue dont les énoncés, phonologiquement identiques à ceux de la langue des non-mutants, sont syntaxiquement et sémantiquement plus complexes et ainsi plus faciles à traiter pragmatiquement. En outre, dans la langue de ces mutants, de nouveaux signes linguistiques peuvent émerger et se stabiliser par un processus de grammaticalisation inaccessible aux non-mutants. Par exemple des pronoms, inintelligibles aux non-mutants, pourraient venir prendre la place des arguments non exprimés.

Cet exemple imaginaire illustre la façon dont une faculté de langage plus avancée, amenant les individus qui en sont dotés à intérioriser un code plus riche que celui de leur communauté, peut émerger et évoluer. Soulignons qu’il ne peut en aller ainsi que dans un système de communication inférentielle. Dans un système de communication par encodage et décodage, tout écart par rapport à la grammaire commune sera désavantageux ou au mieux neutre, mais ne pourra guère être avantageux.

Ces considérations s’appliquent à toutes les étapes éventuelles de l’évolution de la faculté de langage et aussi à son émergence initiale. Etre disposé à traiter un comportement communicationnel non-codé comme un signal codé peut faciliter la compréhension inférentielle des intentions du communicateur et mener à la conventionnalisation de ce type de comportement en tant que signal.

Pour conclure, il est commun de dire que c’est le langage qui différencie avant tout les hommes des autres animaux. Ce n’est que la moitié de la vérité. L’esprit humain se distingue non pas par une, mais par deux capacités cognitives, l’une et l’autre sans véritable équivalent dans d’autres espèces terrestres : le langage en effet, mais aussi la psychologie spontanée, c’est-à-dire la capacité de tout un chacun de se représenter les états mentaux d’autrui (voir Origgi 2001, Sperber 2000, Tomasello 1999). Nous avons suggéré que c’est grâce à l’interaction de ces deux capacités que la communication humaine a pu se développer et acquérir une puissance incomparable. Dans une perspective pragmatique, il est clair en effet que la faculté de langage et les langues humaines, avec leur richesse et leurs imperfections, ne sont adaptatives qu’au sein d’une espèce déjà capable de psychologie spontanée et de communication inférentielle. La psychologie spontanée se verra à son tour extraordinairement enrichie par la communication linguistique. L’évolution relativement rapide des langues elles-mêmes et leur variabilité à l’intérieur de chaque communauté linguistique – ces deux traits étant associés – ne s’expliquent bien, elles aussi, que si la fonction du langage dans la communication est de fournir des indices sur le sens voulu et non de l’encoder.

Dans ces conditions, l’étude de l’évolution du langage devra être étroitement associée à celle de l’évolution de la psychologie spontanée. De même l’étude de l’évolution des langues doit prendre systématiquement en considération leur dimension pragmatique. Tel n’est pas encore le cas. On peut donc prédire que les hypothèses sur l’évolution du langage et des langues, qui se sont rapidement développées au cours des dernières deux décennies, devraient connaître elles-mêmes de nouvelles avancées dans les années à venir.

Références

Allen, C., Bekoff, M. & Lauder, G. (eds.) (1998). Nature’s purposes: Analyses of function and design in biology. Cambridge, Mass. MIT Press.

Baron-Cohen, S., Tager-Flusberg, H. & Cohen, D. J. (2000) Understanding Other Minds, Second edition, New York, Oxford University Press.

Byrne, R. & Whiten, A. (eds. ) (1988) Machiavellian Intelligence : Social Expertise and Evolution of Intellect in Monkeys, Apes and Humans, Oxford : Oxford University Press.

Carston, Robyn. 2002. Thoughts and Utterances: The Pragmatics of Explicit Communication. Blackwell, Oxford.

Dessalles, J-L. (2000) Aux origines du langage. Une histoire naturelle de la parole, Paris, Hermès.

Ducrot, O. (1972) Dire et ne pas dire, Paris, Hermann.

Ducrot, Oswald. 1984. Le Dire et le Dit. Minuit, Paris.

Dunbar, R. I. M. (1996) Grooming, Gossip and the Evolution of Language, London, Faber & Faber.

Geschwind, N. (1980) Some comments on the neurology of language. In Biological studies of mental processes, ed. D. Caplan. MIT Press.

Grice, H. Paul. 1989. Studies in the Way of Words. Harvard University Press, Cambridge MA.

Grice, P. (1957) “Meaning”, Philosophical Review, 66 : 377-88.

Grice, P. (1992) Studies in the Ways of Words, Cambridge, Mass., Harvard University Press.

Hamilton, W. D. (1964) “The Genetical Evolution of Social Behaviour” , Journal of Theoretical Biology, 7 : 1-16.

Levinson, S.C. (1983) Pragmatics, Cambridge : Cambridge University Press.

Levinson, S.C.. (2000) Presumptive Meanings: The Theory of Generalized Conversational Implicature. Cambridge, Mass., MIT Press.

Millikan, R. (1984) Language, Thought and Other Biological Categories, Cambridge, Mass., MIT Press.

Origgi, G. & Sperber, D. (2000) Evolution, communication and the proper function of language. In P. Carruthers & A. Chamberlain (eds.) Evolution and the Human Mind, Cambridge, Cambridge University Press : 140-169.

Origgi, G. (2001) Interpretare il linguaggio e interpretare gli altri : una o due teorie? Sistemi Intelligenti, XIII : 171-188.

Piattelli-Palmarini, M. (1989) Evolution, selection and cognition: from “learning” to parameter setting in biology and in the study of Language. Cognition, 31: pp. 1-44

Pinker, S. & Bloom, P. (1990) Natural Language and Natural Selection. Behavioral and Brain Sciences, 13 : 707-784.

Pinker, S. (1994) The Language Instinct, New York, Penguin.

Recanati, F. 2004a. Literal Meaning. Cambridge University Press, Cambridge.

Sperber, D. (1994) Understanding Verbal Understanding. In J. Khalfa (ed.) What is Intelligence ? Cambridge, Cambridge University Press : 179-98.

Sperber, D. (2000) Metarepresentations in an Evolutionary Perspective. In D. Sperber (ed.) Metarepresentations, Oxford, Basil Blackwell.

Sperber, D. & Wilson, D. (1989), La Pertinence, Communication et Cognition. Paris, Minuit.

Tomasello, M. (1999). The Cultural Origins of Human Cognition. Cambridge, Mass., Harvard University Press.

Tooby, J & Cosmides, L. (1990) On the universality of human nature and the uniqueness of the individual: the role of genetics and adaptation. Journal of Personality, 58: 17-67.

Victorri B. (1999) « La place de la fonction narrative dans l’émergence du langage et la structure des langues », T.L.E. (Théorie, Littérature, Enseignement), 17:23-38.