— Mais, heu, est-ce que des automates cellulaires peuvent contenir de l’information ? demanda-t-elle.
— Ah, mais oui, dit Anna. En fait, Wolfram a publié un article sur une façon de les coder à des fins cryptographiques. C’était en, hmm, 1986, je crois. Et des gens ont essayé de développer des systèmes à clef publique avec des automates.
— Et donc, poursuivit Kuroda, toujours est-il que George Zipf était un linguiste de Harvard. Dans les années 30, il a remarqué une chose fascinante. Dans tout langage, la fréquence à laquelle un mot est utilisé est inversement proportionnelle à son classement dans la table de fréquence d’usage de l’ensemble des mots de ce langage. Cela signifie…
Calculatrix n’a pas besoin qu’on la materne !
— Cela signifie, enchaîna Caitlin, que le deuxième mot le plus fréquent est utilisé deux fois moins que le premier de la liste, le troisième trois fois moins, etc. (Elle fronça les sourcils.) Mais c’est vraiment ce qu’on constate ?
— Oui, dit Kuroda. En anglais, le mot le plus fréquent est « the », puis « of », ensuite « to », et ensuite… hem, je crois bien que c’est « in ». Et effectivement, « in » est utilisé quatre fois moins souvent que « the ».
— Mais c’est certainement spécifique à l’anglais, non ? dit Caitlin en ajustant sa position sur la table.
— Non, c’est la même chose en japonais. (Kuroda récita une liste de mots dans cette langue.) Ce sont les quatre mots les plus fréquents, et ils apparaissent dans ces mêmes ratios inverses.
— Et c’est également vrai pour l’hébreu, ajouta Anna.
— Mais ce qui est vraiment stupéfiant, dit Kuroda, c’est que cette règle ne s’applique pas qu’aux mots. Elle est également valable pour les lettres : la quatrième en anglais, dans l’ordre de fréquence, est « O », utilisée quatre fois moins que la lettre « E » qui est la plus courante. Et cela marche aussi pour les phonèmes – la plus petite unité du langage – et encore une fois, dans toutes les langues, depuis l’arabe jusqu’au…
Il s’interrompit, cherchant manifestement une langue commençant par « Z ».
— Au zoulou ? proposa Caitlin qui avait finalement décidé de participer.
— Voilà, merci.
Elle réfléchit un instant. Pas de doute, c’était drôlement cool…
— Tout ce que vient de dire Masayuki est exact, dit Anna, mais tu sais ce qui est encore plus intéressant, Caitlin ? Ce ratio inverse s’applique également au chant des dauphins.
Ah, ça, c’était géant …
— Vraiment ? dit Caitlin.
— Oui, confirma Kuroda. En fait, on peut utiliser cette technique pour déterminer s’il y a de l’information dans les sons produits par n’importe quel animal. S’il y en a, elle doit respecter la loi de Zipf, et alors, si on trace la courbe de fréquence d’utilisation des composants selon une double échelle logarithmique, on obtient une droite de pente -1.
Caitlin hocha la tête.
— Ah oui, une diagonale descendant de gauche à droite.
— Exactement, dit Kuroda. Et quand on trace le graphique des sons émis par les dauphins, on obtient une pente -1. Mais si l’on prend les cris des singes-écureuils, par exemple, on obtient tout au mieux une pente de -0,6 du fait qu’ils sont en grande partie aléatoires. Même les gens du SETI, qui cherchent à détecter des signes d’intelligence extraterrestre, se sont mis à utiliser les diagrammes de Zipf, parce que cette relation inverse est une propriété de l’information, et non pas seulement d’une approche du langage particulière aux humains.
Oui, très bien, très bien. C’était vraiment des maths cool.
— Et maintenant, poursuivit Kuroda sur un ton toujours destiné à l’amadouer, vous comprenez pourquoi j’aime ce domaine ? Ah, vous connaissez cette vieille blague de John Gordon, celle de l’étudiant en théorie de l’information qui débarque à l’université ?
— Ah, non, fit Anna, par pitié !
Mais Kuroda ne fut pas découragé pour autant.
— Eh bien, dit-il, l’étudiant se présente au département des études et il entend les professeurs qui se lancent des nombres. Par exemple, il y en a un qui s’écrie : « 74 ! », et tout le monde se met à rire. Et puis un autre dit quelque chose comme « 812 ! », et tous de s’esclaffer encore une fois.
— Mmmh ? fit Caitlin.
— L’étudiant demande alors ce qui se passe et un professeur lui dit : « On se raconte des blagues. Mais comme ça fait très longtemps qu’on travaille ensemble, on les connaît toutes par cœur. Il y en a mille, et comme nous sommes des théoriciens de l’information, nous leur avons appliqué un algorithme de compression de données, et chacune porte un numéro de 0 à 999. Allez-y, essayez vous-même. » Et l’étudiant dit un nombre au hasard : « 63. » Mais personne ne rit. Il en essaie un autre : « 512. » Toujours rien. « Qu’est-ce qui se passe ? » demande-t-il. « Pourquoi personne ne rit ? » Et le professeur lui répond gentiment : « Ce n’est pas seulement la blague… il y a aussi la façon de la raconter. » Caitlin ne put s’empêcher de sourire.
— Mais, poursuivit Kuroda, un jour que l’étudiant examinait un bulletin météo sur le Grand Nord, il s’exclama : « Moins 40 ! » Et tous les professeurs éclatèrent de rire.
Il s’arrêta. Caitlin lui demanda :
— Pourquoi ?
— Parce que, répondit-il (et au ton de sa voix, elle sut qu’il arborait un large sourire), c’était une blague qu’ils ne connaissaient pas !
Cette fois-ci, Caitlin éclata franchement de rire. Elle commençait à se sentir mieux, mais son père fit :
— Ahem (en le prononçant en deux syllabes bien distinctes, pas seulement pour s’éclaircir la gorge). Si nous nous mettions au travail ?
— Ah, excusez-moi, dit Kuroda qui semblait quand même avoir gardé son sourire. Très bien, allons-y…
Il utilisa la même technique qu’auparavant pour prendre des instantanés du flot de données que l’implant de Caitlin recevait de Jagster. Au bout de quelques essais, ils réussirent à trouver un rythme de rafraîchissement permettant de voir les incréments élémentaires – une seule itération selon les règles de comportement des automates cellulaires qui les faisaient osciller entre noir et blanc. Caitlin pouvait maintenant voir se déplacer les vaisseaux spatiaux sans manquer une seule étape.
Kuroda n’avait aucun moyen de laisser passer uniquement les automates cellulaires, mais Caitlin pouvait facilement faire abstraction du reste en se concentrant sur une partie seulement de l’arrière-plan.
— Et maintenant, Malcolm, dit Kuroda, puisqu’on parlait de Mathematica, est-ce que vous avez le logiciel ?
— Oui, bien sûr. On doit pouvoir y accéder d’ici. Si vous me permettez…
Caitlin les entendit se déplacer, puis un « Ah, merci » de Kuroda à son père.
— Parfait, dit-il, et maintenant, lançons le diagramme de Zipf. (Quelques cliquetis de touches.) Bien sûr, nous allons devoir essayer plusieurs formes de découpage des données, pour être sûrs que nous isolons bien des unités distinctes d’information. D’abord, nous allons…
— Là ! l’interrompit le père de Caitlin qui avait vraiment l’air très excité.
— Qu’est-ce qu’il y a ? fit Caitlin.
— Ma foi, dit Kuroda, nous y sommes, n’est-ce pas ?
— Mais qu’est-ce qu’il y a ? répéta Caitlin plus fermement.
— Vous êtes sûre que vous ne vous concentrez que sur les automates cellulaires ? lui demanda Kuroda.
— Oui, oui.
— Eh bien, ce que nous obtenons en les observant osciller entre noir et blanc, c’est une ravissante diagonale – qui descend de gauche à droite. Une belle droite de pente -1 de bout en bout.
Читать дальше