Que savons-nous de la langue?

Vous n’y prêtez probablement guère attention, car cela nous est si naturel. Vous le faites en ce moment et vous y êtes très doué. Vous le faites également lorsque vous parlez au téléphone. Lorsque vous passez du temps avec vos amis. Lorsque vous lisez le journal. Lorsque vous regardez les nouvelles. C’est ce talent surprenant que tout humain acquiert quand on n’a que quelques années. À partir de là, nous nous améliorons rapidement, jusqu’à ce que nous maîtrisions vraiment la compétence. Ce talent qui s’appelle le traitement du langage. Le talent de parler, d’écouter, de lire et d’écrire. Tant d’excellents articles et livres ont été écrits sur ce talent que l’on peut facilement affirmer que tout a maintenant été dit à ce sujet. Et pourtant, une question très simple, quelle langue nous connaissons, n’a pas tout à fait été répondu, peut-être parce que la réponse s’avère si difficile. Combien de langue savons-nous vraiment?

Il y a bien sûr une série de facteurs dont nous devons tenir compte pour répondre à cette question. Vous pouvez vous demander: voulez-vous dire pour une langue ou pour plusieurs langues qu’une personne parle? Voulez-vous dire produire un langage oral et écrit ou voulez-vous dire comprendre le langage? Et la réponse ne dépend-elle pas de l’âge? Ce sont toutes des questions valables, mais simplifions la question autant que possible et concentrons-nous sur approximativement la part de la langue anglaise que nous comprenons.

En 2016, mes collègues ont conçu une expérience intelligente pour trouver la réponse. Ils ont donné à 221 268 participants à une expérience une liste de mots et on leur a demandé d’indiquer s’ils connaissaient ces mots. Bien sûr, ils voulaient éviter aux participants de répondre qu’ils connaissaient tous les mots qui leur étaient présentés. Mais c’est ici que l’intelligence est intervenue. Soixante-six pour cent des mots étaient de vrais mots de la langue anglaise, mais 33% n’étaient pas des mots. Non-mots comme mal, molk et rontence. Ils ressemblaient à des mots anglais mais ne l’étaient en fait pas. Sur la base du taux d’erreur des participants, ils ont pu corriger les suppositions. Sur la base des résultats corrigés des suppositions, ils ont estimé que les jeunes de 20 ans connaissent environ 42 000 mots différents et les 60 ans environ 48 200 mots différents. D’autres ont estimé que le nombre se situait davantage dans une fourchette d’environ 60 000 mots.

Cependant, ces mots n’incluent pas les expressions à plusieurs mots comme le beurre de cacahuète, le parking et les feux de signalisation (et connaître ces mots individuellement ne vous amène pas tout à fait à l’expression à plusieurs mots). Ils n’incluaient pas de noms comme Beyoncé, Facebook, ou alors Washington Soit.

Mais. Nous. Fais. Pas. Lis. Mots. Nous lisons des phrases. Et cela fait une réponse à la question de savoir combien de langue nous connaissons encore plus difficile. Nous ne pouvons pas simplement supposer que la réponse au nombre de phrases que nous connaissons est le nombre de combinaisons de tous les mots que nous connaissons, 60 000 x 60 000 = 3 600 000 000 phrases. Les mots de combinaisons de numéros de phrase de réponse, par exemple, ne sont pas une phrase. Il faut donc considérer la grammaire, la structure de la phrase qui permet certaines combinaisons de mots mais pas toutes les combinaisons.

Essayons donc de calculer les nombres (supportez-moi). En tant qu’expérience de pensée, supposons d’abord que nous n’avons que six mots que nous connaissons, plutôt que ces 60 000 mots. Supposons que ces six mots se composent de trois noms (John, Marie, et Jeanne) et trois verbes (les coups, Beats et câlins). A partir de ce vocabulaire assez limité de six mots et d’une structure de phrase que l’anglais a (nom verbe nom), nous pouvons générer 27 phrases différentes (Mary embrasse Jane, Mary frappe John, Jane bat Mary étant trois d’entre eux). Parce que la structure de la phrase peut également consister en une combinaison nom-verbe (John étreint), le nombre passe à 36.

Rowman et Littlefield / Prométhée

Couverture « Garder ces mots à l’esprit: comment le langage crée du sens »

Source: Rowman et Littlefield / Prometheus

D’accord, prenons ceci à la langue anglaise dans son ensemble. Nous savons que la longueur moyenne des phrases est de 15 à 20 mots, alors supposons que les phrases que nous connaissons peuvent contenir un maximum de 20 mots. Qu’une phrase dure 20 mots n’est pas tout à fait vrai, car nous pouvons facilement créer des phrases qui dépassent considérablement 20 mots, comme celle-ci. Mais restons fidèles à 20 mots dans une phrase et supposons que les phrases peuvent être de 3 mots, 4 mots et ainsi de suite.

Nous savons également que dans la langue que nous utilisons, nous utilisons environ 19% de noms, 27% de verbes, 6% d’adverbes, 3% d’adjectifs, 21% de pronom, 7% de prépositions et les 15% restants sont constitués de déterminants, coordinateurs, modaux, subordinateurs et les particules adverbiales. Nous pouvons maintenant estimer le nombre de noms, verbes, adjectifs, adverbes et autres catégories dans une phrase de 3 mots, des phrases de 4 mots, une phrase de 5 mots, jusqu’à une phrase de 20 mots, notre longueur de phrase maximale. Sur les 60 000 mots que nous connaissons, nous avons environ 14 400 noms à notre disposition, 16 800 verbes et quelques pronoms, ce qui se traduit par plus de 30 000 combinaisons de noms, verbes et pronoms. On estime alors qu’une phrase de 10 mots a deux noms, trois verbes, un adverbe, deux pronoms et une préposition. Cela signifie que les permutations possibles d’une phrase de 10 mots sont supérieures à 4 741 000 000 000 de phrases. Si nous ajoutons maintenant le nombre de permutations d’une phrase de trois mots à une phrase de 20 mots, nous finissons par interpréter plus de 5 000 000 000 000 000 000 000 de phrases. Mais jusqu’à présent, nous supposons que l’ordre des classes de mots dans une phrase reste constant. Ce n’est évidemment pas le cas. Alors simplifions à nouveau la situation et supposons qu’il n’y a que deux variations d’ordre des mots dans une phrase. Si nous ne prenons en compte que les variations d’ordre de deux mots, nous pouvons supposer que nous connaissons au moins 10 000 000 000 000 000 000 000 de phrases, soit 10 sextillions de phrases!

Combien ça fait? Eh bien, supposons qu’un quotidien moyen compte environ 120 000 mots et nous estimons à environ 10 mots par phrase environ 12 000 phrases. Le nombre de phrases que nous connaissons est le même que le nombre de phrases que nous ressentons en lisant chaque seconde de notre vie – de la naissance jusqu’à notre mort – 8 500 journaux! Donc, la prochaine fois que vous êtes à une fête et que les gens se vantent du dernier accord qu’ils ont conclu, de la voiture qu’ils ont achetée ou des nombreux kilomètres qu’ils ont parcourus, vous pouvez également vous vanter. Vous connaissez autant de phrases qui sont publiées dans 8 500 journaux à chaque seconde de votre vie, environ 10 sextillions de phrases (ne leur dites pas qu’elles connaissent elles aussi autant de langage).

Avant d’objecter qu’il est injuste de compter le nombre de mots de cette façon, sans parler du nombre de phrases, parce que si vous connaissez le système de règles derrière les mots et les phrases, il ne faut pas compter les mots et les phrases individuellement, vous avez raison. Mais ce n’est pas le but. Le but ici est de s’émerveiller devant le talent impressionnant que nous avons qui passe souvent inaperçu car il nous vient si naturel. Avoir une idée du nombre de langues que nous connaissons nous amène à la question de savoir comment garder ces mots à l’esprit. C’est une question que je garderai pour plus tard La psychologie aujourd’hui blog (et pour un livre scientifique populaire qui sortira bientôt)!