dimanche 5 décembre 2010

A0136 Litteratus Calculus: Leçon Numéro 1

Au milieu des années 1980, je m'occupais de l'intelligence artificielle à Bull. Nous menions des projets d'interrogation en langage naturel de bases de données relationnelles (projets Corail et Sesame).
En fait, cela consistait à habiller de langage naturel le schéma conceptuel de la base de données, et c'était en fait très peu naturel. Si l'on modifiait le schéma de la base, il fallait faire évoluer le modèle du langage naturel généré, en faisant appel à des linguistes et à leurs lourds formalismes.
Les données restaient entièrement rigides, leur structure totalement figée, totalement prisonnière de l'engineering, qu'il soit linguistique ou informatique.  Aucune couche de peinture naturelle ne pouvait masquer la dictature de l'ingénierie logicielle sous-jacente.

J'en tirai la conclusion que le langage naturel ne devait pas être à la périphérie, à l'interface du système d'information, mais en son cœur même: ce sont les données qui devaient être en langage naturel.
Aux informaticiens de se débrouiller ensuite avec!

"Les données en langage naturel", ça veut dire ça:

Si on a une table de base de données avec une colonne Nom et une colonne Adresse, et si,  sur la même ligne, on trouve dans ces deux colonnes  "Pierre" et "Paris", l'information correspondante  peut s'énoncer ainsi en langage naturel:

"Pierre habite Paris"

Si on fait ça pour chacune des cellules de chacune des  tables relationnelles d'un système d'information, on peut remplacer tout notre système d'information par un ensemble de phrases en langage naturel, comme "Pierre habite Paris".

Il suffit ensuite d'écrire des programmes qui vont travailler sur ce matériau naturel: c'est le propos du "calcul littéraire", dit aussi "litteratus calculus" en latin, que nous allons développer dans la deuxième leçon.

2 commentaires:

EHDLT a dit…

Bonjour Jean Rohmer

Je suis Michel Louis Lévy, le père de Jean-Claude. Je me demande si le projet de "Big Tree" du logiciel de généalogie "Geni" n'est pas en rapport avec votre "calcul littéraire". Voici le message reçu ce jour de "Geni".

En toute sympathie

MLL

Cher Michel,

Geni’s mission is to create a shared family tree that connects all of our users. We wanted to share a little bit more about what this vision means and how we are going to get there.

For centuries, people have studied their family history in order to document their ancestors and find new relatives. However, there has never been a great way to share the results of this research with relatives, or collaborate together with others researching common relatives. As a result, the same ancestors are researched over and over again, often from scratch. By combining this research into a single tree that everyone can work on together, users can focus on verifying information and on new avenues of research, rather than spend their time duplicating research that somebody else has already done.

Because users start with their own tree when they first join Geni, they often add relatives that are already part of other Geni trees. All of these duplicates must be merged together to create the one shared tree that we are working towards. Over 45 million profiles have already been linked together on Geni into what is known as the "Big Tree".

In order to help accomplish this goal, Geni Curators can now merge together duplicate public profiles that are in different trees. Public profiles are distant relatives and ancestors (your third great grandparents and beyond) that may be shared by many other users. As public profiles you’re connected to are merged with their duplicates, you’ll instantly benefit from other users’ research, and maybe even meet some new distant cousins.

As always, we take the privacy of your close relatives very seriously. Profiles for close relatives that you’ve added to Geni are private, which means that only you and your family can view these profiles. Only your close relatives can merge your private profiles, and even if your tree is merged with another tree, your close relatives will remain private to you and your family.

A few more things:

You can always export your tree as a GEDCOM file if you’d like to keep a local copy
For more on profile privacy, see our Understanding Privacy on Geni page
If you have any other questions or concerns about this, please let us know at help@geni.com
- L'équipe de Geni

Jean Rohmer a dit…

Merci de cette piste. C'est un bon exemple, car à priori, les informations généalogiques devraient se prêter à la structuration. Avec des structures de données assez simples: mariages et naissances. Mais le plus difficile ici n'est pas la structuration, mais les identités des choses qui entrent dans les structures: des identités de personnes, des identités de lieux. L'approche ontologique universelle, qui est celle du W3C et du Web Sémantique, consiste à voir la solution dans l'existence d'un grand registre unique de tous les individus, et d'un grand registre unique de tous les lieux de la terre. Le point de vue du calcul littéraire est que ceci est une grossière utopie. Qui a autorité pour remplir ce registre, qui a assez de science pour décider que telle entrée est bien celle qui concerne notre ancêtre ? Décider de l'identité de deux "inscriptions" est une des questions les plus complexes dans le domaine du traitement de l'information. J'imaginerais plutôt un système où un acteur A pourrait inscrire qu'il considère -jusqu'à plus informé- que l'inscription B désigne la même chose que l'inscription C. A charge ensuite pour tout un chacun d'étudier et de déduire... Si, comme le dit Jean-Claude Levy, les informaticiens ont réussi à créer le désordre sans espace, il ne faut surtout pas qu'ils se mettent en tête de créer un espace pour rétablir l'ordre, et qu'ils considèrent les adresses internet comme des coordonnées dans un un espace topologique, et encore moins métrique.