3.3. Recherche d’information - L'intelligence Artificielle

Le web sémantiquetechniques qui visent à organiser et exploiter les informations présentes sur le web (liens, connaissances* ontologiques, etc.) afin notamment d’en permettre un traitement automatisé et d’obtenir ainsi par exemple des réponses plus pertinentes aux requêtes des utilisateurs. (voir aussi : ontologie*)... More est une application à grande échelle des travaux de recherche en représentation de connaissances* (cf. section “Représenter l’information”). Il est nourri par un web de donnéesinformations ayant un caractère factuel, car se rapportant à des cas singuliers, elles peuvent provenir notamment de capteurs, ou de recueils auprès de personnes. C’est devenu un fait de société, que les données (en anglais “Data”) abondent dans de nombreux domaines, et qu’il faut en... More liées (“Linked Data”) offrant de manière distribuée de grandes quantités d’information. Ces informations sont décrites dans le langage RDF(Resource Description Framework, en français Cadre de Description des Ressources) un des langages standards du web sémantique*, permettant de décrire des liens entre des ressources web, du type sujet- prédicat-objet (par exemple “Impression soleil levant - a été peint par - Claude Monet”), chacun des... More* qui permet d’exprimer des (méta-)donnéesinformations ayant un caractère factuel, car se rapportant à des cas singuliers, elles peuvent provenir notamment de capteurs, ou de recueils auprès de personnes. C’est devenu un fait de société, que les données (en anglais “Data”) abondent dans de nombreux domaines, et qu’il faut en... More sous forme de graphes dont les nœuds sont identifiés, comme les pages du web, par des IRI (Internationalized Resource Identifier), et les classes et relations peuvent être définies par des termes d’une ontologieensemble structuré de connaissances* formalisées, partagées par une communauté, pour décrire et raisonner sur un domaine d’application, utilisé très largement pour le web sémantique* et pour les connaissances médicales.... More* utilisant le langage OWL(Web Ontology Language, en français Langage d’Ontologie pour le Web) un des langages standards du web sémantique*, permettant de représenter (et de raisonner sur) des ontologies*, c’est-à-dire des concepts, des classes, et leurs relations.... More*.

Bien sûr, cela ne signifie pas que l’ordinateur comprend le sens des symboles utilisés : ce n’est pas parce que les termes “escalade” et “Mont Granier” sont attachés à une image que l’ordinateur sait ce qu’est l’escalade, ni ce qu’est un mont. Mais il est possible d’utiliser des techniques d’intelligence artificielle de sorte que l’ordinateur se comporte de manière pas si éloignée de ce qu’il ferait s’il comprenait.

Des techniques fondées sur la fréquence de co-occurrences de motifs (et en particulier de mots) permettent de déterminer une proximité assez fiable entre ces motifs. Elles associeront par exemple les mots “mont”, “montagne”, “massif ”, “escalade”, “avalanche”, mais aussi “neige” et “donnéesinformations ayant un caractère factuel, car se rapportant à des cas singuliers, elles peuvent provenir notamment de capteurs, ou de recueils auprès de personnes. C’est devenu un fait de société, que les données (en anglais “Data”) abondent dans de nombreux domaines, et qu’il faut en... More” (à cause de l’expression actuelle “avalanche de donnéesinformations ayant un caractère factuel, car se rapportant à des cas singuliers, elles peuvent provenir notamment de capteurs, ou de recueils auprès de personnes. C’est devenu un fait de société, que les données (en anglais “Data”) abondent dans de nombreux domaines, et qu’il faut en... More”). Cependant, dans un contexte où sont présents “massif ” et “escalade”, “neige” sera plus proche de “montagne” que “donnéesinformations ayant un caractère factuel, car se rapportant à des cas singuliers, elles peuvent provenir notamment de capteurs, ou de recueils auprès de personnes. C’est devenu un fait de société, que les données (en anglais “Data”) abondent dans de nombreux domaines, et qu’il faut en... More”. Pour définir cette similarité, on considère ces termes comme des dimensions d’un espace vectoriel, dont les points caractérisent des documents. Ces dimensions sont réduites en rapprochant celles associées le plus souvent : c’est la base de “latent semantic analysisen français analyse sémantique latente, désigne un procédé d’indexation sémantique, utilisé dans le traitement des documents en langue naturelle, dans le cadre de la sémantique vectorielle, où chaque composante (associée à un mot) d’un vecteur représentant un document correspond au poids du mot dans ce... More*” et des “word embeddings*”. Cela fonctionne entre documents (textuels ou multi-médias) de langues différentes si on dispose d’un corpus annoté multilingue.

La fouille de donnéesinformations ayant un caractère factuel, car se rapportant à des cas singuliers, elles peuvent provenir notamment de capteurs, ou de recueils auprès de personnes. C’est devenu un fait de société, que les données (en anglais “Data”) abondent dans de nombreux domaines, et qu’il faut en... More permet d’extraire des motifs fondés sur des propriétés structurelles. Par exemple, on va trouver une classe d’objets, les montagnes, décrits par leurs noms, leurs altitudes, leurs massifs et parfois leurs coordonnées géographiques. Organiser le résultat de la fouille en une représentation explicite de la connaissancedans l’acception spécifique de ce mot, les connaissances ont en principe un caractère générique, souvent sous forme de règles (par exemple, « les hommes sont mortels », « les oiseaux volent »...). Elles sont en général recueillies auprès d’experts (voir aussi ontologies*), ou obtenues à... More est l’objet de la découverte de connaissancedans l’acception spécifique de ce mot, les connaissances ont en principe un caractère générique, souvent sous forme de règles (par exemple, « les hommes sont mortels », « les oiseaux volent »...). Elles sont en général recueillies auprès d’experts (voir aussi ontologies*), ou obtenues à... More qui peut organiser les motifs extraits en une véritable ontologieensemble structuré de connaissances* formalisées, partagées par une communauté, pour décrire et raisonner sur un domaine d’application, utilisé très largement pour le web sémantique* et pour les connaissances médicales.... More des objets géographiques comme les montagnes, les rivières, les massifs et les relations entre eux (qu’une montagne fait éventuellement partie d’un massif montagneux et qu’elle peut être localisée dans un ou plusieurs pays).

Enfin, à partir d’une telle représentation de la connaissancedans l’acception spécifique de ce mot, les connaissances ont en principe un caractère générique, souvent sous forme de règles (par exemple, « les hommes sont mortels », « les oiseaux volent »...). Elles sont en général recueillies auprès d’experts (voir aussi ontologies*), ou obtenues à... More, il est possible de déduire de nouvelles informations, d’identifier les descriptions d’un même objet ou de répondre à des requêtes. Ainsi, quelqu’un cherchant des images d’“alpinisme dans le massif de la Chartreuse”, pourra se voir retourner une image étiquetée “escalade” et “Mont Granier”. Pour cela, le système enchaînera des étapes de raisonnement sur différents éléments de connaissances, à savoir que ”escalade” est une catégorie d’“alpinisme” et que le “Mont Granier” est situé dans le “massif de la Chartreuse”.