<?xml version="1.0" encoding="UTF-8"?><!-- generator="wordpress.com" -->
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	>

<channel>
	<title>moteur-de-recherche-acceder-aux-contenus &amp;laquo; WordPress.com Tag Feed</title>
	<link>http://wordpress.com/tag/moteur-de-recherche-acceder-aux-contenus/</link>
	<description>Feed of posts on WordPress.com tagged "moteur-de-recherche-acceder-aux-contenus"</description>
	<pubDate>Mon, 13 Oct 2008 08:07:48 +0000</pubDate>

	<generator>http://wordpress.com/tags/</generator>
	<language>en</language>

<item>
<title><![CDATA[L'absence de preuves n'est pas la preuve de l'absence]]></title>
<link>http://mondeca.wordpress.com/?p=95</link>
<pubDate>Sat, 24 May 2008 12:30:39 +0000</pubDate>
<dc:creator>Thomas Francart</dc:creator>
<guid>http://mondeca.fr.wordpress.com/2008/05/24/labsence-de-preuves-nest-pas-la-preuve-de-labsence/</guid>
<description><![CDATA[Qu&#8217;on en commun la recherche de la vie extra-terrestre et la recherche des armes de destructio]]></description>
<content:encoded><![CDATA[<p>Qu'on en commun la recherche de la vie extra-terrestre et la recherche des armes de destruction massive en Irak ?</p>
<p>Elles supposent toutes les deux que le monde est ouvert, et que ce n'est pas parce qu'on n'a rien trouvé qu'il n'y a rien; dans l'un et l'autre cas, l'absence de preuve n'est pas la preuve de l'absence(*).</p>
<p>Dans le monde ouvert des recherches sur le "web of data", hé bien c'est pareil.</p>
<p><!--more--></p>
<p>Si vous travaillez sur un ensemble de données sur un domaine, rien ne vous dit que quelqu'un, quelque part, n'a pas publié des données qui complètent, voire contredisent, les vôtres.<br />
Le cas d'utilisation que nous avons est le suivant : nous avons les données de jour de fermeture des équipements touristiques (musées, attractions, etc.), par exemple :</p>
<pre>:WidgetMuseum   :openingPeriod   _:p1
_:p1      :begins     2008-03-01
_:p1      :ends        2008-10-31
_:p1      :closingDay      :Tuesday
_:p1      :closingDay      :Sunday</pre>
<p>Pouvons-nous en déduire, dans un monde ouvert, que les jours d'ouverture sont lundi, mercredi, jeudi, vendredi et samedi ?<br />
Non. Pour cela il faut lever cette assomption, en déclarant dans l'ontologie que tous les jours qui ne sont pas fermés sont ouverts. Ou alors, cette déduction peut se faire par une négation en SPARQL, en utilisant <a href="http://www.w3.org/TR/rdf-sparql-query/#func-bound" target="_blank">cette astuce</a> :</p>
<pre>CONSTRUCT { ?s :openingDay ?dayofweek }
WHERE
  {
    :WidgetMuseum   :openingPeriod ?s
    ?s :begins 2008-03-01 .
    ?s :ends        2008-10-31 .
    ?dayofwee a somedictionary:dayOfWeek .
<span style="color:#0000ff;">    OPTIONAL { ?s2 :closingDay ?dayofweek . FILTER (?s2 = ?s) }</span>
<span style="color:#0000ff;">    FILTER (!bound (?s2))</span>
  }</pre>
<p>Je construis "s est un jour d'ouverture" si je ne trouve aucun s2 tel que s2 est un jour de fermeture et s2 = s (le truc difficile à appréhender ici est le fait d'utiliser une variable s2 différente de s, mais en disant que s2 = s. Si on utilisait directement s, s serait toujours "bindée", puisque les statements qui sont avant la clause optionnelle peuvent très bien renvoyer une réponse à eux tout seul).</p>
<p>Maintenant, serait-il possible d'éliminer l'assomption que quelqu'un, quelque part, ait pu publier de la donnée complémentaire/contradictoire avec la mienne ? pourquoi ne pas imaginer un système qui serait capable d'interroger l'intégralité des données publiées sur le web ? si un tel système existait, cela éliminerait du coup l'assomption du monde ouvert; quel serait alors l'architecture d'un tel système ? grosso modo, cela pourrait être soit :</p>
<ul>
<li>Un "google du web of data", un super index de toutes les données RDF publiées sur le web; une super base de connaissances planétaire, en somme;</li>
<li>Une architecture décentralisée, à base d'agents détenant chacun un bout de réseau de connaissances, étant capables de discuter entre eux, de savoir quel agent détient quel type de donnée, à base d'annuaires, de rediriger les requêtes vers tel autre agent, etc.</li>
</ul>
<p>Si la première solution semble d'un point de vue ingénierie la plus directe, sa centralisation (logique) pose tout de même question; la seconde solution se rapprocherait plus de la philosophie du web, et si elle est plus floue en terme de mise en œuvre, elle n'en reste sans doute pas moins valable.<br />
(autre chose un peu annexe : une fois l'ensemble des données publiées interrogeables, quid du "data-rank", un algorithme de classement des résultats d'une recherche inspiré du "page-rank" ?)<br />
Et vous, qu'en pensez-vous ?</p>
<p>______<br />
(*) : Pour la formidable citation de Rumsfeld sur la justification de la guerre en Irak, voir <a href="http://www.unabstract.net/concept.php?id=10387" target="_blank">ici</a>. Et pour la recherche de la vie extra-terrestre, voir <a href="http://fr.wikipedia.org/wiki/Paradoxe_de_Fermi" target="_blank">là</a>.</p>
]]></content:encoded>
</item>
<item>
<title><![CDATA[Carto 2.0 : Mondeca sera présent !]]></title>
<link>http://mondeca.wordpress.com/?p=92</link>
<pubDate>Fri, 21 Mar 2008 08:51:04 +0000</pubDate>
<dc:creator>Christophe Tricot</dc:creator>
<guid>http://mondeca.fr.wordpress.com/2008/03/21/carto-20-mondeca-sera-present/</guid>
<description><![CDATA[“Où en êtes-vous de la mise en scène de vos informations ?”
 Face à la quantité d’informa]]></description>
<content:encoded><![CDATA[<p><b>“Où en êtes-vous de la mise en scène de vos informations ?”</b></p>
<p class="MsoNormal" style="margin-right:1.15pt;"><b> </b><span>Face à la quantité d’information sans cesse croissante que les organisations sont contraintes de gérer, leur <span class="MiseenValeur">mise en scène au travers de représentations graphiques</span> permet de mieux les </span>appréhender<span> et les valoriser. Intelligence économique, gestion des connaissances, apprentissage, réseaux sociaux,<span>  </span>aide à la décision sont autant de domaines où la cartographie de l’information est de plus en plus populaire car elle permet en amont <span class="MiseenValeur">d’organiser et d’appréhender des données</span>, puis en aval <span class="MiseenValeur">d’évaluer et de communiquer</span> les résultats obtenus. Cette journée sera donc l’occasion de mettre en valeur le <span class="MiseenValeur">rôle majeur </span>que peux jouer la cartographie dans nos sociétés dîtes de l’information.</span></p>
<p><span style="font-size:9pt;"> </span><br />
<b>Jean Delahousse, fondateur de la société Mondeca, interviendra sur le thème : </b><i>« Cartographie et Ontologie : Généricité, réutilisabilité et spécificité »</i></p>
<p>Il<span>  </span>présentera comment il est possible dans le contexte des technologies du Web Sémantique et des ontologies, de disposer de composants de représentation cartographique des connaissances réutilisables dans des contextes métiers très diverses.<!--more--> Il fera également une typologie des composants élémentaires de représentation des connaissances utilisés dans le cadre de mise en place de portails sémantiques. <span> </span>La présentation s’appuiera sur une expérience très opérationnelle acquise dans le cadre de projets et sur une réflexion menée au travers des travaux de recherche de l’équipe Mondeca.</p>
<p><span>Dans le prolongement de sa première édition, <b>Carto2.0 </b>s’adresse aux utilisateurs, professionnels de l’information, dirigeants, décideurs opérationnels, spécialistes industriels, chercheurs, gestionnaires des risques,<i>etc</i>.</span></p>
<p>Les thèmes couverts par l’évènement seront très variés : intelligence économique, gestion des connaissances, crises, risques et décisions, pédagogie et apprentissage, intelligence collective, <i>etc</i>.</p>
<p>Le <a href="http://carto20.hautetfort.com/archive/2008/03/18/le-programme-detaille.html" target="_blank">programme détaillé</a> du colloque du jeudi 3 avril vient d'être publié sur le blog :</p>
<div style="text-align:center;"><img src="http://carto20.hautetfort.com/media/00/00/1133275932.png" height="277" width="193" /></div>
<p>Dans ce PDF de 24 pages  vous pourrez consulter pour chacune des conférences prévues un bref CV de l'intervenant(e) et un résumé de son intervention.</p>
<p><b>Le jeudi 3 avril 2008 à Noisy le Grand de 9h à 19h00</b><b><br />
<b>ESIEE : 2, boulevard Blaise Pascal - Cité Descartes, Noisy le Grand (93)</b></b></p>
<p>Pour plus d’informations : www.carto2point0.com</p>
<p>Rendez-vous à Carto 2.0 !</p>
<p class="MsoNormal">&#160;</p>
<p class="MsoNormal">PS : Si vous comptez assister au colloque penser à <a href="http://carto20.hautetfort.com/archive/2008/03/01/comment-s-inscrire.html" target="_blank">vous inscrire rapidement</a> : le jeudi 3 avril arrive à grande vitesse !</p>
]]></content:encoded>
</item>
<item>
<title><![CDATA[De la bibliothéque aux taxonomies, de la conversation au Web 2.0, de la critique littéraire aux Listmania, de l'expert aux bases de connaissances, des concordances bibliques aux index plein texte: Continuité et révolution dans l'accès aux contenus]]></title>
<link>http://mondeca.wordpress.com/2007/11/11/outils-et-methodes-d%e2%80%99acces-aux-contenus-via-internet-continuite-et-revolution/</link>
<pubDate>Sun, 11 Nov 2007 22:49:01 +0000</pubDate>
<dc:creator>Jean Delahousse</dc:creator>
<guid>http://mondeca.fr.wordpress.com/2007/11/11/outils-et-methodes-d%e2%80%99acces-aux-contenus-via-internet-continuite-et-revolution/</guid>
<description><![CDATA[&nbsp;
Offrir un accès efficace à des tablettes, rouleaux,  documents, livres, chapitres, paragrap]]></description>
<content:encoded><![CDATA[<p class="Section1">&#160;</p>
<p class="MsoNormal">Offrir un accès efficace à des tablettes, rouleaux,  documents, livres, chapitres, paragraphes, versets a préoccupé les hommes depuis  la création de l’écrit (en tout cas une petite partie d’entre eux) dans un  esprit de service aux lecteurs. Aujourd’hui nous avons la même préoccupation  dans un univers de contenus numériques et de réseaux internet.La mise à  disposition des contenus ou de leurs références via l’internet entraine  mécaniquement un besoin de transposition des méthodes d’accès aux contenus dans  un environnement numérique. Cette migration dans un environnement numérisé qui  dispose de capacités de traitement occasionne une évolution de ces outils et  méthodes, l’apparition de nouvelles techniques de médiation mais aussi  l’émergence de nouvelles pratiques dans leur utilisation et leur couplage.</p>
<p class="MsoNormal"><!--more--></p>
<p class="MsoNormal">La préoccupation de guider les hommes dans l’accès aux ouvrages et textes (comme les  cartes routières nous guident pour trouver notre destination) a été partagée par  Callimaque de Cyrène archiviste de la bibliothèque d’Alexandrie qui en rédige le  premier catalogue raisonné en 120 rouleaux, Robert Estienne, imprimeur, qui en  premier eut l'idée de découper la Bible en versets pour en faciliter l'étude en  1551, par les auteurs quand il rédigent le sommaire de leurs ouvrages, par le  patient travail des responsables des index chez les éditeurs juridiques, par le  thésard qui rédige une bibliographie sur son domaine de recherche, par Dewey qui  conçoit la classification décimale visant à classer l'ensemble du savoir humain  à l'intérieur d'une bibliothèque, par Bernard Pivot quand il  édite « la bibliothèque idéale », par les équipes d’Amazon quand elles  construisent les taxonomies permettant de filtrer leur offre de livres…</p>
<p class="MsoNormal">Sans souvent nous en rendre compte, tant ces services nous  semblent naturels, nous utilisons ces outils pour sélectionner et accéder aux  ouvrages qui nous intéressent ou dont nous avons besoin. Pourtant ces méthodes  d’accès aux ouvrages qui nous paraissent si naturelles ont été pensées et créées  progressivement au cours des siècles en fonction des besoins. Elles sont  arrivées, dans le monde de l’imprimé, à une phase de stabilité et de maturité au  cours du XXème siècle.</p>
<p class="MsoNormal">En une trentaine d’années seulement, les progrès de l’informatique et de  l’internet ont remis en cause ces moyens d’accès aux contenus. Les nouveaux  documents n’existent souvent qu’en  version numérisée, des ouvrages anciens sont en cours de numérisation, les  catalogues des ouvrages imprimés sont disponibles sur l’internet…</p>
<p class="MsoNormal">Ces évolutions ont eu plusieurs conséquences sur les moyens  d’accès aux documents :</p>
<ul>
<li>Les moyens  d’accès doivent mener à des ouvrages numériques comme à des ouvrages papier</li>
<li>Les moyens  d’accès doivent être gérés numériquement afin d’être disponibles à partir de  l’ordinateur, outil privilégié d’accès aux contenus</li>
<li>Les  technologies de l’informatique, de la linguistique et de la logique permettent  d’automatiser certaines tâches, d’enrichir les fonctionnalités des outils  d’accès mais aussi d’en inventer de nouveaux.</li>
</ul>
<p class="MsoNormal">Dans cet article, nous tenterons de faire un inventaire des  différents outils d’accès aux ouvrages et contenus dans un environnement  internet, mais aussi de les repositionner dans leur continuité historique  puisque la majorité d’entre eux sont la continuité de méthodes déjà éprouvés  dans le monde de l’imprimé.</p>
<p class="MsoNormal">Cet article ne traite que des outils textuels d’accès aux  contenus (index, tables, bibliographies…) et n’aborde pas les outils graphiques  ou iconographiques. Cet article n’a pas non plus comme objectif de traiter de la  navigation à l’intérieur des ouvrages ou articles mais bien de s’intéresser à  tout ce qui à l’extérieur du contenu lui-même permet d’y accéder.</p>
<h2>Continuité et transformation des outils et services d’accès aux ouvrages et  contenus</h2>
<h3>Des bavardages et discussions aux web 2.0</h3>
<p class="MsoNormal">Le premier moyen d’accès à un ouvrage, un poème, un chapitre,  une recette de cuisine, un article de loi… est probablement le conseil amical ou  professionnel : il faut que tu lises cela…, vous devriez trouver ce que vous  chercher dans cet ouvrage…, voici quelques livres pour ton anniversaire…, sur  une île déserte je prendrais….</p>
<p class="MsoNormal">Ces conseils amicaux, éducatifs, professionnels,  dictatoriaux… ont trouvé une continuité naturelle sur le web par la  multiplication des possibilités d’échanges : mail, blog, wiki… Leur puissance a  été décuplée car ils ne s’adressent plus un ami ou collègue mais à tous les  anonymes qui auront l’occasion des les lire via internet. Autre avantage  notable, dans la majorité des cas le conseil donne également un lien directe sur  le contenu numérique ou un lien sur le libraire en ligne qui se fera un plaisir  de vous faire parvenir l’ouvrage.</p>
<h3>De l’avis des critiques professionnels aux avis de personnes reconnues dans  leur communauté</h3>
<p class="MsoNormal">L’échange ou le conseil amical ou pédagogique se  professionnalise avec le travail des critiques. Leurs analyses critiques,  publiées dans la presse, sont un moyen d’accès aux ouvrages et contenus. J’irai  acheter tel roman recommandé dans le supplément livres du Monde ou la rubrique  Livres de Elle ou tel article commenté dans une revue spécialisée.</p>
<p class="MsoNormal">L’internet et le Web 2.0 on eu un double effet sur ce type  d’accès aux ouvrages :</p>
<ul>
<li>La publication  en ligne des critiques ce qui les rend accessible à un public plus large</li>
<li>L’historisation de ces critiques qui me permette de les  retrouver plusieurs mois après</li>
<li>La  multiplication des vocations de critique, activité qui n’est plus réservée à des  professionnels rémunérés par la presse mais s’ouvre à tout lecteur voulant faire  part de son avis avec la bénédiction et le soutien des librairies en ligne (voir  les avis des lecteurs dans Amazon ou la Fnac).</li>
</ul>
<h3>La publicité</h3>
<p class="MsoNormal">La publicité pour les ouvrages, que ce soit celle d’un roman  à la radio ou d’un ouvrage spécialisé de droit dans une revue professionnelle  est un moyen de communication et d’accès à un contenu ou un ouvrage. Dans le  Web, principalement sous s’impulsion d’Amazon, la publicité pour les livres  c’est considérablement développée. La capacité de faire apparaître les  publicités en fonction du contenu de la page consultée a permis d’affiner les  cibles client et de transformer les publicités en un quasi service pour les  lecteurs (publicité contextuelle). Le lien est maintenant presque direct entre  la publicité et l’ouvrage : un clic nous amène à la fiche décrivant l’ouvrage  dans le catalogue, on pourra probablement en consulter des extraits sans  l’acquérir, un dernier clic et un N° de carte de crédit nous permettent de  l’acquérir.</p>
<h3>Des bibliographies aux playlists, listmania</h3>
<p class="MsoNormal">Les conseils ponctuels de lecture peuvent se transformer en  un réel travail de sélection d’ouvrages ou contenus sur une thématique réalisée  par un expert d’un domaine : c’est la bibliographie. On sort du conseil  personnalisé pour aller vers une notion de service pédagogique s’adressant à ses  étudiants ou à des d’anonymes qui voudraient être guidés dans l’étude d’un champ  de savoir.</p>
<p class="MsoNormal">L’organisation, la disposition, la typographie des  bibliographies ont fait l’objet d’un soin et d’une standardisation progressive,  en particulier dans le monde universitaire. On trouve les bibliographies sous  forme numérique sur le web avec quelques aménagements typographiques et  techniques permettant entre autre de pointer directement sur le document  numérique.</p>
<p class="MsoNormal">Mais la bibliographie a pris un essor nouveau et s’est  rapidement « démocratisée » avec la possibilité de publier des « listes » dans  le web. Cette fonction ce retrouve dans de nombreux environnements  collaboratifs : site Amazon avec ListMania, liste  d’ouvrages préférés, liste de poèmes préférés dans les sites communautaires...  La mise à disposition de listes personnelles d’ouvrages touche tous les  domaines : musical, cinéma, touristique… les documents écrits et livres ne sont  ici qu’un média parmi les autres.</p>
<h3>Identifier un objet en décrivant ses caractéristiques : de la demande à un  expert au formulaire de recherche dans un catalogue</h3>
<p class="MsoNormal">Quand la recherche est très ciblée, que l’on souhaite  utiliser des critères détaillés sur le sujet de la recherche ou le type  d’ouvrage, on peut se tourner directement vers l’expert du domaine pour lui  demander « mais quel ouvrage me conseillez vous sur ce point particulier ? » ou  « chez quel éditeur puis je trouver ce texte de Tolstoï ? », ou se tourner vers  l’interrogation directe de catalogues spécialisés (catalogue d’une bibliothèque,  d’un éditeur, d’un libraire, d’une base de données scientifique). Le formulaire  de recherche qui permet de décrire sa recherche en utilisant tous les champs  détaillés du catalogue est alors le moyen d’accès à l’ouvrage, ou à l’article.  Le résultat peut être une fiche descriptive ou un accès direct au contenu.</p>
<h3>De la liste des bestsellers à de nouveaux types de listes basées sur les  statistiques</h3>
<p class="MsoNormal">L’utilisation des statistiques comme moyen de constituer des  listes d’accès aux ouvrages est courant : liste des best-sellers, liste des  meilleures ventes, liste des ouvrages élus par les lectrices d’un magazine…</p>
<p class="MsoNormal">L’internet a permis de généraliser ces listes sur des  critères plus variés, plus fins et donnent des résultats en temps réel :</p>
<ul>
<li>Statistiques  des meilleures ventes selon des catégories ajustables par l’utilisateur, par  exemple « meilleures ventes de livre de cuisine italienne en français »</li>
<li>Statistiques  sur les évaluations des livres par les lecteurs</li>
<li>Statistiques  sur l’accès aux contenus (nombre de personnes ayant accédé à ces contenus la  semaine dernière, le mois dernier, au total… - ce type de données est très  utilisé dans les blogs)</li>
<li>Statistiques  sur le nombre de recommandations ou références à ce contenu (Google)</li>
</ul>
<h3>De la table des matières à la navigation dans un site éditorial – plan de  site</h3>
<p class="MsoNormal">La table des matières, qui détaille les différentes parties  de l’ouvrage et la page ou débute chaque partie, est bien un outil d’accès aux  différentes parties d’un ouvrage. Ces tables des matières peuvent être simples  quand elles donnent les chapitres des « Malheurs de Sophie » ou très  importantes, détaillées, organisées selon plusieurs niveaux pour un ouvrage  juridique.</p>
<p class="MsoNormal">Ces tables de matières sont également disponibles dans les  ouvrages numériques organisés comme des livres. On trouve par exemple dans Adobe  une navigation dans le texte à partir d’une table des matières qui apparait à  gauche du texte. Les tables des matières comme moyen de comprendre le contenu  sont également valorisées par Amazon qui pour de nombreux ouvrages fait l’effort  de numériser les tables des matières.</p>
<p class="MsoNormal">Mais le web a entraîné la création de nouveaux types de  présentations éditoriales comme le site web où les différents contenus sont  disposés dans des pages autonomes. La présentation de l’organisation du contenu  et la navigation repose sur une organisation hiérarchique des différents  contenus qui apparait dans le site sous forme de liens de navigation. Une vision  synthétique de l’organisation de l’ensemble des pages est en général disponible  sous le nom de « plan du site ».</p>
<h3>De l’organisation d’une bibliothèque à la recherche à facettes</h3>
<p class="MsoNormal">L’organisation physique des livres dans une bibliothèque  privée, publique, chez un libraire est toujours un choix, une décision motivée  par le désir de fournir un accès compréhensible, utilisable, lisible à ceux qui  viennent chercher l’information. Ces choix sont très divers en fonction de la  taille du fonds, de la spécialisation de la bibliothèque (généraliste,  enfantine, historique, scientifique, d’entreprise…), des contraintes de  rangements (où mettre les très grands livres qui ne rentrent pas dans le  rayonnage prévu pour sa thématique ?). L’organisation physique des ouvrages dans  les rayonnages d’un libraire par exemple, repose très généralement sur une  première organisation basée sur un  classement thématique (histoire, roman, voyage, médecine…) et un second niveau de classement dont le choix  est assez variable ; ordre alphabétique des auteurs, éditeur puis ordre  alphabétique des auteurs, ordre d’arrivée… avec des sous organisation ad-hoc  (taille des livres, fragilité..).</p>
<p class="MsoNormal">Dans les rayonnages le rangement et l’ordre des livres ne  peux être qu’unique, si l’utilisateur ne l’apprécie pas il n’a pas le loisir de  réorganiser la bibliothèque ou la librairie pour ses besoins propres mais il trouvera peut être une autre  bibliothèque ou librairie lui proposant une organisation plus adaptée à son  besoin.</p>
<p class="MsoNormal">Le besoin de pouvoir se diriger rapidement vers un ensemble  d’ouvrages et de contenus correspondant à la thématique de notre recherche a été  résolu dans le monde numérique par la capacité de filtrer un ensemble de  contenus sur plusieurs facettes (thématique, éditeur, auteur, date d’édition,  langue de l’ouvrage…) et d’organiser la liste résultante dans l’ordre qui nous  convient (ordre alphabétique des auteurs, des titres, des maisons d’édition,  plus forte vente, meilleurs critiques des lecteurs…).</p>
<p class="MsoNormal">La sélection par des facettes ou via des « taxonomies de  navigation » nous permet de réorganiser en une seconde en ensemble d’ouvrages  pour nous constituer une bibliothèque ou librairie numérique adaptée à notre  besoin du moment : bibliothèque des livres de cuisine américains publiés avant 1950, bibliothèque des  ouvrages en français sur la seconde guerre mondiale…</p>
<p class="MsoNormal">La recherche à facettes repose sur le même principe que  l’organisation des bibliothèques : choisir des caractéristiques des ouvrages  (thématique, langue, auteur, titre, éditeur, critiques..) et organiser la  présentation des ouvrages selon certains de ces critères.</p>
<p class="MsoNormal">La magie (le terme ici semble approprié) est de pouvoir en  une seconde réorganiser l’ensemble du fonds selon les critères de notre choix.</p>
<h3>Des index de l’encyclopédie aux index dans une publication web</h3>
<p class="MsoNormal">L’outil le plus fin d’accès aux contenus est l’index : une  liste de sujets organisés avec soin par un spécialiste nous donne un accès  direct aux contenus au niveau de l’article, du paragraphe, du verset. La  mécanique est précise, la liste des contenus pertinente et complète (nous  parlons ici d’un bon index, construit avec soin).</p>
<p class="MsoNormal">L’index peut être  simple ou composé de plusieurs index et tables :</p>
<ul>
<li>index  thématique,</li>
<li>index des  personnages cités,</li>
<li>index des  lieux,</li>
<li>index des  ouvrages cités,</li>
<li>tables des  iconographies…</li>
</ul>
<p class="MsoNormal">L’index donne tout à la fois une vision très fine des sujets  traités dans l’ouvrage, une navigation alphabétique et hiérarchique dans cette  liste de sujets et un accès direct aux contenus en indiquant le N° de la page ou  un lien directe sur le contenu quand il s’agit d’un ou une publication web.</p>
<p class="MsoNormal">La qualité des index est très variable, elle dépend :</p>
<ul>
<li>du type de  contenu; les index des ouvrages  juridiques, scientifiques et des encyclopédies sont en général de grande  qualité</li>
<li>des éditeurs  et auteurs qui apportent un soin inégal aux index</li>
<li>des traditions  éditoriales ; les éditeurs anglo-saxons, sont en général, plus soucieux que  d’autres de la qualité des index</li>
</ul>
<p class="MsoNormal">La création d’un index et sa maintenance pour les nouvelles éditions représentent un  travail complexe : choix d’une liste de sujets, organisation hiérarchique quand  les sujets ont plusieurs niveaux de détail, choix de synonymes pour nommer  certains sujets, renvois entre sujets, création des références entre les sujets  et les textes de l’ouvrage…</p>
<p class="MsoNormal">Le service rendu par un index dépend beaucoup de la taille de  l’ouvrage et de la complexité des sujets ; c’est pour certains ouvrages et  utilisateurs l’index est le premier outil utilisé pour accéder au contenu et le  seul apportant un réel gain de temps et de productivité (droits,  réglementations, médecine..).</p>
<p class="MsoNormal">Pour les contenus publiés sous forme de sites web ou  portails, la mise à disposition d’un index est assez rare en particulier dans  les sites francophones. On trouve souvent de très bons index dans les sites  gouvernementaux anglo-saxons.</p>
<p class="MsoNormal">Plusieurs facteurs jouent pour un retour à la mise à  disposition d’index pour l’accès aux contenus :</p>
<ul>
<li class="MsoNormal">Qualité de service : offrir  aux utilisateurs une cartographie complète des sujets traités, de leur  granularité et de leurs relations</li>
<li class="MsoNormal">Qualité de service :  indiquer  comment les sujets traités sont  nommés dans la collection de contenus, évitant ainsi les longs tâtonnements des  utilisateurs</li>
<li class="MsoNormal">Référencement dans les  moteurs de recherche : la mise à disposition aux moteurs de recherche internes  ou généralistes (Google, Yahoo…) d’index thématiques oriente leur travail  d’indexation et améliore la visibilité des contenus dans les moteurs</li>
<li class="MsoNormal">Automatisation : apparition  d’outils automatiques ou semi-automatiques de génération d’index thématiques  s’appuyant sur différentes techniques linguistiques, sur des thésaurus  existants, sur les métadonnées présentes dans les documents</li>
</ul>
<h3>Des connaissances de l’expert aux connaissances transformées en services aux  utilisateurs</h3>
<p class="MsoNormal">Dans l’édition papier, l’index et les tables constituent le  degré le plus sophistiqué de présentation d’une liste de sujets et de leurs  relations. Les contraintes de l’édition papier n’autorisent en effet qu’une  présentation sous forme de listes de sujets complétées de renvois vers d’autres  sujets.</p>
<p class="MsoNormal">Au final seul les experts d’un domaine sont à même d’avoir  une représentation fine des relations entre les sujets d’un domaine, d’avoir une  cartographie des connaissances et c’est vers l’expert que l’on se tourne  traditionnellement pour une recherche complexe nécessitant une bonne  connaissance du domaine (avocat, médecin, agent de voyage, fiscaliste, expert  technique...).</p>
<p class="MsoNormal">L’informatique autorise une nouvelle approche de l’accès aux  contenus via une description fine des sujets d’un domaine et de leurs relations,  une représentation des connaissances du domaine. Cette nouvelle approche est  incarnée dans les technologies du web sémantique, des ontologies, de la  représentation sémantique des connaissances.</p>
<p class="MsoNormal">Les services rendus sont de deux ordres :</p>
<ul>
<li>Recherche et  navigation de l’utilisateur au travers d’une représentation des connaissances du  domaine</li>
<li>Automatisation  partielle des recherches par la machine qui utilise la représentation des  connaissances du domaine pour faire des raisonnements et navigation et  identifier les contenus utiles</li>
</ul>
<h4>Recherche et navigation de l’utilisateur dans une représentation des  connaissances du domaine</h4>
<p class="MsoNormal">Dans la même philosophie que celle des index et tables, le  service est :</p>
<ul>
<li>de fournir un  inventaire raisonné des sujets traités dans un domaine</li>
<li>de décrire les  différentes relations qu’ils entretiennent (est une partie de, est  contradictoire avec, a un impact sur, est confirmé par, participe à, est  localisé à, s’applique à telle population…),</li>
<li>de pouvoir  rechercher et naviguer au travers de ces sujets par type de sujets (auteurs,  thématiques, lieux, technologies, types d’objet…),</li>
<li>de pouvoir  naviguer entre les sujets en utilisant leurs relations</li>
</ul>
<p class="MsoNormal">et finalement de pouvoir accéder aux contenus référencés.</p>
<p class="MsoNormal">Le développement et la maintenance des outils d’accès aux  contenus basés sur une représentation des connaissances du domaine nécessitent  des investissements humains et technologiques plus importants qu’une indexation  plein texte des contenus puisqu’elle mobilise les experts du domaine. Pourtant  cette approche est retenue pour différents systèmes car elle permet un important  saut de productivité pour les utilisateurs comme un important saut qualitatif  sur la précision et complétude des réponses.</p>
<p class="MsoNormal">Certains secteurs d’activité disposent à la fois des moyens  et d’un enjeu économique pour systématiser ce type d’approche, comme par  exemple :</p>
<ul>
<li>les centres  d’appel de plus en plus spécialisés sur des domaines techniques, légaux,  fiscaux, administratifs doivent tout à la fois répondre de manière précise et  exhaustive car ils engagent leur responsabilité, employer des personnes non  expertes du domaine, manipuler un contenu complexe et en constante évolution,   respecter des critères de productivité  très stricts (ex : centre d’appel des impôts américains)</li>
<li>les sites de  e-commerce qui souhaitent offrir en amont de leurs produits un savoir détaillé  sur leur domaine pour fidéliser le client et augmenter les ventes : un vendeur  d’articles de sports gérera une base de connaissance sur les différents sports,  règles du jeu, club, événements, un vendeur de composants informatiques mettra à  disposition des bases de connaissances permettant de choisir les composants,  configurer les machines…</li>
<li>les éditeurs  juridiques qui souhaitent garder une valeur ajoutée les différentiant des autres  sources d’information et offrent à leurs abonnés professionnels de véritables  bases de connaissances juridiques pour accéder aux contenus législatifs,  réglementaires et à la jurisprudence</li>
</ul>
<h4>Automatisation de l’accès à des contenus</h4>
<p class="MsoNormal">Les bases de connaissances, si elles sont bien conçues,  formellement représentées, peuvent devenir la base à des services automatisés  d’accès aux contenus sur la base d’une description du besoin de  l’utilisateur :</p>
<ul>
<li>création en  temps d’une documentation réglementaire personnalisée concernant un navire  marchand en fonction de caractéristiques et dates de contrôle</li>
<li>création d’une  documentation personnalisée sur les subventions possible à l’embauche en  fonction des caractéristiques de l’entreprise et du profil de la personne à  recruter</li>
<li>aide à la  création d’un voyage avec ce que cela implique de choix, de disponibilité, de  tarification</li>
</ul>
<p class="MsoNormal" style="margin-left:36pt;"><strong> </strong></p>
<h3>L’accès direct à une chaîne de caractères : une expérience nouvelle</h3>
<p class="MsoNormal">L’accès au contenu par la recherche d’une série de mots est  un mode d’accès révolutionnaire, moins par son principe que par l’automatisation  du processus et la rapidité d’accès au contenu (on retrouve en effet  l’application du principe de la recherche plein texte dans les « concordances  bibliques » où chaque mot de la Bible est classé de manière alphabétique,  accompagné de la phrase où il se trouve et de sa référence. cf note 1)</p>
<p class="MsoNormal">La rupture introduite par les technologies de moteurs de  recherche vient de l’automatisation du processus, de l’incroyable rapidité des  recherches et du très faible coût d’indexation des documents.</p>
<p class="MsoNormal">Cette méthode présente certaines limites :</p>
<ul>
<li>elle ne  pas être mise en place que pour les  contenus textuels (ce qui exclu les images, vidéo…)</li>
<li>les contenus  textuels doivent être numérisés</li>
<li>le contenu  plein texte doit être disponible ce qui exclu tous les ouvrages ou contenus qui  ne sont pas mis à disposition dans leur texte intégral par leur propriétaire,  soit la plupart des livres, articles de journaux…</li>
</ul>
<p>L’efficacité brutale de la méthode  a fait ses preuves dans les moteurs de recherche généraliste comme dans les  sites web pour un travail de fouille de contenus. Les limites de la méthode sont  liées à son manque de finesse, au nombre de contenus non pertinents remontés  ainsi qu’à l’impossibilité de savoir si les réponses sont exhaustives. Cette  critique s’adresse plus aux méthodes de recherche s’appuyant sur une indexation  plein texte, qu’aux moteurs de recherche qui quand ils sont utilisés plus  finement pour indexer des mots clés, des champs structurés, des métadonnées  donnent des résultats d’une grande précision.</p>
<h3>Le flux RSS – se constituer un index vivant des nouvelles publications</h3>
<p class="MsoNormal">Les flux RSS peuvent également être classés dans une  technologie en rupture. Ils permettent en sélectionnant un éditeur de contenus  et éventuellement une thématique particulière d’être averti de toutes les  nouvelles informations parues par un bref message donnant le titre du contenu,  un rapide résumé et un lien sur le contenu. Les outils de lecture des flux RSS  (par exemple NetVibes) quand ils agrègent de nombreux  fils RSS sélectionnés soigneusement par l’utilisateur en fonction de ses centres  d’intérêt constituent de véritables index thématiques automatiquement mis à jour  et fédérant des contenus de multiples sources.</p>
<h2>Combinaison des modes d’accès</h2>
<p class="MsoNormal">L’ensemble de ces modes d’accès sont disponibles dans une  plateforme unifiée, répandue et d’un faible coût : un ordinateur connecté à  l’internet. En se combinant dans une plateforme unique, ils démultiplient leur  efficacité :</p>
<ul>
<li>Une publicité  contextuelle pour un ouvrage apparait lors de la lecture d’un texte, un clic  permet d’accéder au site d’Amazon, on peut consulter le sommaire de l’ouvrage,  sa présentation par l’éditeur et des retours de lecture. Un autre clic permet de  consulter dans le catalogue les autres ouvrages de l’auteur. En copiant le nom  de l’auteur dans Google on arrivera à un lien sur la fiche Wikipédia parlant de cet auteur…</li>
<li>En revenant  sur la liste des personnes ayant commenté l’ouvrage, on accédera probablement  aux listes qu’ils ont pu constituer sur d’autres ouvrages qu’ils aiment dans le  même domaine…</li>
</ul>
<p class="MsoNormal">En quelques minutes nous avons utilisés une dizaine de mode  d’accès différents aux contenus, sans réellement en prendre conscience. Pourtant  cette expérience repose bien sur les efforts conjugués des auteurs, éditeurs,  distributeurs ou communautés d’intérêt dont les efforts conjugués permettent un  accès efficace et rapide aux contenus.</p>
<h2>Continuité des modes d’accès, révolution de l’expérience de  l’utilisateur</h2>
<p class="MsoNormal">On voit que dans leur majorité les principes d’accès aux  contenus préexistaient à la numérisation et à la généralisation d’internet. La  rupture technique vient réellement de la combinaison des différents modes  d’accès à partir d’un outil unique, de la rapidité des opérations réalisées, de  la fédération des contenus et de la fédération des moyens d’accès dans outil  unique.</p>
<p class="MsoNormal">L’expérience pour l’utilisateur est radicalement différente  de ce que l’on pouvait vivre avant les années 90 : disparition des déplacements  physiques, utilisations combinées de moyens d’accès aux contenus, accès direct  aux contenus ou au moins à leur description, publication accélérée des retours  des lecteurs…</p>
<h2>Une convergence rapide de l’ergonomie des outils d’accès aux contenus</h2>
<p class="MsoNormal">L’ergonomie, la mise en page, la manière d’utiliser les  moyens d’accès aux contenus papier ont évolués lentement au long des siècles et  tout particulièrement entre le 17 et 20 ème siècle  pour arriver aux systèmes de classification des bibliothèques publiques, aux  index des encyclopédies, aux règles de mise en page et typographie des  bibliographies, index, catalogues….</p>
<p class="MsoNormal">Les moyens d’accès numériques aux contenus n’ont que quelques  dizaines d’années. Un travail continue, intense, mondial est en cours pour  améliorer l’ergonomie des ces outils, expérimenter de nouveaux modes  d’utilisation, améliorer la mises en page des résultats, trouver des façons  d’assister l’utilisateur.</p>
<p class="MsoNormal">Nous avons vu en une quinzaine d’années apparaître :</p>
<ul>
<li>La navigation  dans les sites web éditoriaux</li>
<li>Le plan de  site du site web</li>
<li>Les moteurs de  recherche basés proposant sur des plans de classement de l’information  (Yahoo)</li>
<li>Les bandeaux  publicitaires</li>
<li>La recherche à  la Google</li>
<li>Les addwords de Google</li>
<li>La recherche à  facette dans les sites e-commerce</li>
<li>Les liens de  suggestion vers d’autres contenus</li>
<li>Les index de  sujets dans des sites professionnels (e-gouvernement, administration)</li>
<li>Les bases de  connaissances thématiques donnant accès à des contenus (par ex dans IMDB,  certains sites touristiques, les bases juridiques)</li>
<li>L’arrivée des  listes personnelles (musiques, livres)</li>
<li>Les flux  RSS</li>
</ul>
<p class="MsoNormal"><span class="GramE">et</span> pour chacun de ces moyens d’accès  nous avons constaté une évolution rapide et continue de l’ergonomie, de la mise  en page, de l’intégration des services.</p>
<p class="MsoNormal">Les sites de e-commerce, qui donnent accès à de grandes  quantités de contenus/produits déjà bien décrits dans des catalogues structurés,  ont été particulièrement innovants dans leur effort pour offrir des outils d’accès simples et puissants. Ils prennent un  soin particulier à offrir une ergonomie qui ne fera pas fuir les clients, ils  essayent de vendre plus de produits tout en rendant un service qui fidélisera le  client (ex : service de suggestion de livres sur Amazon).</p>
<p class="MsoNormal">Pendant cette période d’évolution rapide des moyens d’accès  aux contenus, les éditeurs de portails et sites doivent veiller à remettre à  niveau les services qu’ils proposent de manière quasi continue ou devenir force  de proposition pour offrir des services d’accès plus efficace que ceux de leurs  concurrents (Fnac vs Amazon, LexisNexis vs Wolters Kluwer, Elsevier vs Thomson…)</p>
<p class="MsoNormal">Comme dans le monde de l’imprimé, mais dans un laps de temps  beaucoup plus court, on arrivera progressivement à une ergonomie, une grammaire,  des modes d’utilisation assez standardisés de services d’accès aux contenus pour  le plus grand bénéfice des utilisateurs et la relative tranquillité des  éditeurs.</p>
<h2>Au cœur des systèmes d’accès aux contenus et connaissances : la sémantique,  le concept, le sujet</h2>
<p class="MsoNormal">Les outils d’accès aux contenus forment une infrastructure  d’organisation indépendante des contenus mais pointant vers eux (par des liens,  par des références d’ouvrage…). Ces infrastructures d’accès aux contenus sont  composées de sujets organisés entre eux pour un usage particulier : index des  sujets traités, taxonomies pour la recherche à facette, bibliographies sur un  sujet donné…</p>
<p class="MsoNormal">Les technologies du web sémantique et des ontologies ont été  imaginées et conçues pour traiter de la description des sujets et pour gérer leur organisation :</p>
<ul>
<li>La norme ISO Topic Maps a eu comme premier objectif de gérer des index  complexes basés sur une description des connaissances d’un domaine,</li>
<li>Les premières  descriptions du Web Sémantique donnaient  comme objectif le traitement automatiquement des relations entre les sujets pour  un accès assisté aux contenus et produits….</li>
</ul>
<p class="MsoNormal">L’objectif principal des technologies du Web Sémantique est  de fournir des normes, des outils et des méthodologies pour construire des  outils efficaces, ouverts, normalisés, interopérables d’accès aux contenus  utilisables aussi bien par les hommes que par les machines.</p>
<p class="MsoNormal">Pour la première fois, nous disposons, au travers de  technologies interopérables :</p>
<ul>
<li>des références  précises pour identifier les  contenus</li>
<li>de grandes  quantités de contenus sous forme numérisée</li>
<li>d’une très  large palette de technologies d’accès aux contenus</li>
</ul>
<p class="MsoNormal">Le travail à faire pour améliorer les outils d’accès aux  contenus, leur normalisation et leur interopérabilité comme le travail à faire  pour augmenter la part des contenus disponibles sous forme numérique reste  considérable, mais ce travail est en cours sous l’impulsion conjuguée des  acteurs privés et publics et des communautés d’intérêt.</p>
<p class="MsoNormal">On peut parier que nous jugerons un jour les solutions  actuelles d’accès aux contenus via l'internet comme archaïques et désordonnées mais que certains  (peu d’entre nous) regretterons cette période de mise au point, de créativité et d’inventivité  journalière visant à choisir les meilleurs outils, méthodes et ergonomies.</p>
<h6>Note 1 : Hugues de Saint Cher, mort en 1263, dominicain, est  à l'initiative de la première concordance biblique. VIGNAUX Georges <a href="http://liris.cnrs.fr/as50/Journee-7-juillet/Vignaux-Indexation-classification0703.doc">http://liris.cnrs.fr/as50/Journee-7-juillet/Vignaux-Indexation-classification0703.doc</a></h6>
]]></content:encoded>
</item>
<item>
<title><![CDATA[Les Taxonomies de navigation - La recherche à facettes : Définition, utilisation, objectifs, mise en œuvre.]]></title>
<link>http://mondeca.wordpress.com/2007/10/10/les-taxonomies-de-navigation-la-recherche-a-facettes-definition-utilisation-objectifs-mise-en-oeuvre/</link>
<pubDate>Sun, 07 Oct 2007 20:08:31 +0000</pubDate>
<dc:creator>Jean Delahousse</dc:creator>
<guid>http://mondeca.fr.wordpress.com/2007/10/07/les-taxonomies-de-navigation-la-recherche-a-facettes-definition-utilisation-objectifs-mise-en-oeuvre/</guid>
<description><![CDATA[L’utilisation du web pour donner accès à des contenus riches et structurés est de plus en plus ]]></description>
<content:encoded><![CDATA[<p>L’utilisation du web pour donner accès à des contenus riches et structurés est de plus en plus courant :</p>
<p>- accès à un catalogue de produits</p>
<p>- accès à de la documentation technique, juridique, administrative</p>
<p>- accès à de la documentation scientifique : brevets, articles</p>
<p>- accès à des bases de connaissance : économiques, R&#38;D, people, patrimoine ...</p>
<p>Les informations mises à disposition dans ces sites web sont qualifiées par de nombreuses données : caractéristiques du produit, lieu géographique, taille, prix, âge, sujets traités, ... qui doivent pouvoir être accessibles aux utilisateurs pour filtrer les informations et trouver une liste de réponses correspondant à leurs attentes.</p>
<p><!--more--></p>
<p>Chaque type d'attribut correspond à un axe de recherche, à une facette de la recherche. Par exemple dans le site web faisant la promotion du tourisme d'une région, l’utilisateur pourra filtrer les offres en fonction du type de ressource touristique (hébergement, activité, restauration, patrimoine, culture, artisanat…), en fonction du lieu (région, ville), en fonction de la langue parlée, en fonction de son besoin (s’éclater, se retrouver, découvrir ...).</p>
<p>Pour chacun de ces axes de recherche d’autres axes permettant d’affiner le choix peuvent être proposés; si l’utilisateur a demandé les hébergements on lui proposera d’affiner son choix sur 3 axes complémentaires : type d’hébergement, prix, labellisation de l’hébergement, s’il choisit de rechercher en fonction des activités on lui proposera différents types d’activité : artisanales, sportives, culturelles…</p>
<p>La recherche et le filtrage de l’offre par différents niveaux de choix permettent de guider progressivement l’utilisateur en fonction du contexte de la recherche.</p>
<p>Pour la suite de ce document nous appellerons « Taxonomies de navigation » l’ensemble des critères disponibles pour le filtrage des contenus du site. Ces taxonomies de navigation se décomposent en autant de taxonomies que l’on a d’axes de recherche : exemple : taxonomie géographique, taxonomie des types de produit, taxonomie des labellisations d’hébergement. La taxonomie principale présentée lors de l’accès au site est complétée par des taxonomies contextuelles qui ne sont présentées que pour certains choix de l’utilisateur, exemple : la taxonomie des labellisation d’hébergement n’est présentée que si l’utilisateur à choisi de consulter les hébergements.</p>
<p>Les taxonomies de navigation utilisées pour le filtrage ne sont pas entièrement composées de listes de choix, elles peuvent également inclure des choix de valeurs numériques; par exemple le choix d’un prix maximum et minimum pour un prix d’hôtel ou des valeurs temporelle une plage de date pour sélectionner des événements culturels.</p>
<h3>Taxonomies dynamiques</h3>
<p>Les taxonomies présentées à l’utilisateur au fur et à mesure de sa recherche sont dynamiques à deux titres :</p>
<ul>
<li>elles présentent pour chacune des rubriques des taxonomies le nombre de résultats obtenu pour cette entrée</li>
<li>elles s’adaptent en fonction du contenu sélectionné : si il n’y a aucune activité sportive dans la ville indiquée, la rubrique « activité sportive » disparaîtra du choix donné à l‘utilisateur,</li>
<li>elles s'enrichissent de taxonomies contextuelles au fur et à mesure des choix de l'utilisateur</li>
</ul>
<h3>Les taxonomies de navigation : un choix éditorial et non un choix technique</h3>
<p>Les taxonomies de navigation sont l’équivalent des rayons et la signalétique dans un super marché. L’utilisateur se fait une idée de l'offre à sa disposition par les taxonomies qui lui sont présentées. Les taxonomies de navigation doivent donc répondre à trois objectifs :</p>
<ul>
<li>refléter les contenus mis à disposition par l’éditeur du site</li>
<li>correspondre au public visé</li>
<li>être simples et lisibles</li>
</ul>
<h4>Des taxonomies qui réflétent le contenu mis à disposition par l’éditeur</h4>
<p>Si une région a une politique marketing accès sur la richesse de ses activités sportives, la première taxonomie doit d’abord afficher les principales activités sportives de la région. Si les ressources touristiques de la région sont principalement axées sur les sports nautiques, il serait logique que les premières activités listées soit la voile, le canoë, la pêche plutôt que le tennis et le golf.</p>
<p>On voit que le choix des premiers axes de recherche présentés aux utilisateurs répond aux mêmes contraintes que l’organisation des rayons et des têtes de gondole dans un supermarché ou et aux mêmes contraintes de présentation qu'un catalogue de vente par correspondance.</p>
<h4>Des taxonomies adaptées aux publics visés</h4>
<p>La souplesse du web permet de créer plusieurs portails d’accès aux contenus, comme on trouve pour une même société de vente par correspondance plusieurs catalogues en fonction des cibles de clientèle.</p>
<p>Si la région souhaite segmenter son offre pour un public 20/35 et un public de seniors, elle créera deux portails distincts. Pour chacun des portails les taxonomies de navigation seront différenciées. La liste des activités sportives pour le public jeune mettra en avant les activités rafting, canoe et kayak mais la liste des activités sportives pour un public senior commencera probablement par balade en péniche, pêche...</p>
<h4>Des taxonomies simples à utiliser et comprendre</h4>
<p>Les choix donnés aux utilisateurs doivent être simples à comprendre et efficaces, il est parfois utile de s'implifier l'organisation des contenus ou des offres. Par exemple, les offres d’hébergement utilisent des systèmes de classification hétérogènes ; les étoiles pour les hôtels, les tentes pour les campings, les épis pour les gîtes ruraux avec des variations importantes d‘un pays à l‘autre… L’utilisation directe de ces catégories dans le portail ne serait pas intuitive et exigerait de faire une exploration pour chaque type d’hébergement. Le choix de l'éditeur du site et du marketing est de présenter à l’utilisateur une liste à trois entrées : "luxueux", "standard", "économique", liste permettant de faire un choix sur tous les types d'hébergement en un seul clic.</p>
<h4>Affiner la sélection avec de la recherche plein texte</h4>
<p>Quand l’utilisateur a réalisé la sélection qui lui convient en utilisant les différents axes de recherche, il peut être satisfait du résultat obtenu ou souhaiter l’affiner en s’appuyant sur le texte même. Si la personne souhaite vérifier que les hébergements qu’il a choisi acceptent les chiens, il pourra affiner sa recherche en faisant une recherche sur le mot «chien» dans toutes les offres sélectionnées.</p>
<p>La recherche directe sur le contenu permet d’affiner la sélection sur des critères qui ne sont pas mis à disposition dans les taxonomies mais qui peuvent être présents dans les textes descriptifs.</p>
<h3>Taxonomies de navigation et attributs descriptif des contenus ou des offres</h3>
<p>Les contenus ou les produits mis à disposition dans le portail contiennent de nombreux attributs descriptifs gérés dans une base de données ou sous forme de métadonnées. Exemple :</p>
<ul>
<li>une activité touristique est décrite par : une thématique (équitation, pêche, poterie…), un lieu, une plage de prix, un public visé,</li>
<li>un hébergement est décrit par : un nombre d’étoiles, une plage de prix des chambres, une adresse, les services complémentaires offerts.</li>
</ul>
<p>Les attributs descriptifs des différents contenus ou offres correspondent en général à des tables de référence spécialisées : liste des activités, nomenclature des étoiles d’hôtel, liste des villes, liste des départements, liste de services associés dans l’hôtellerie, liste des moyens de paiement...</p>
<p>L’utilisation directe de ces nomenclatures pour construire les taxonomies de navigation ne permet pas de répondre aux besoins décrit de l'éditeur du site et du marketing :</p>
<ul>
<li>les activités sont décrites dans la nomenclature par ordre alphabétique et par famille de sports alors que l’on veut les activités nautiques en haut de la liste et le sport automobile en second</li>
<li>les classifications des hébergements ne sont pas homogènes pour les hôtels, campings, gîtes ruraux et l’on veut présenter une classification simplifiée valable pour tous les hébergements : luxueux, standard, économique</li>
<li>les adresses n’indiquent que les villes alors que l’on veut regrouper les offres par bassins touristiques</li>
<li>les descriptions techniques des contenus et offres ne comprennent pas certaines information en particulier sur la qualification marketing des offre, par exemple on ne dispose pas d’indication permettant de segmenter les offres entre les 20/35 ans et les seniors.</li>
</ul>
<p>Les taxonomies de navigation sont donc bien distinctes des nomenclatures utilisées pour décrire les contenus et les offres. D’un coté une présentation marketing, ergonomique, unifiée, simplifiée et adaptée à une cible, de l’autre une description détaillée et technique des contenus ou des offres.</p>
<h4>Construire des taxonomies de navigation à partir de la description des contenus et des offres</h4>
<p>Les taxonomies de navigation sont construites par le responsable éditorial du site et par le marketing guidés par un souci valorisation du contenu et des offres. Dans un second temps elles sont confrontés aux données disponibles dans la description des contenus et des offres pour examiner les correspondances entre la taxonomie de navigation souhaitée et les éléments descriptifs des offres et contenus.</p>
<p>La correspondance peut être évidente et directe : la troisième rubrique de la taxonomie: « kayak » a une correspondance « kayak » dans la nomenclature du catalogue des activités.</p>
<p>La correspondance peut être automatisée par un raisonnement simple : la taxonomie géographique présente un premier niveau listant les bassins touristiques et un second niveau indiquant les villes de chaque bassin touristique. Seule l‘indication de la ville est présente dans les attributs décrivant les offres. Quand un utilisateur fera une sélection sur un bassin touristique, le moteur de recherche fera automatiquement une recherche sur toutes les villes du bassin touristique telle que décrit dans la taxonomie.</p>
<p>La correspondance peut nécessiter une requête un peu plus complexe : si un utilisateur sélectionne la rubrique « luxueux » pour les hébergements le moteur de recherche devra sélectionner dans le catalogue hotel les 4 et 5 étoiles, dans la catégorie camping les 4 tentes et dans la catégorie gîtes ruraux les 3 épis (cette requête sera faite en temps réelle ou un index spécifique aura été préparé d'avance par le moteur pour pouvoir répondre plus rapidement).</p>
<h2>Outils logiciels</h2>
<p>Les outils logiciel pour la mise en œuvre simple et évolutive des taxonomies de navigation dans les différents sites et portails d’une entreprise sont de trois types : logiciel de gestion de référentiels terminologiques et taxonomies, moteurs de recherche, interfaces utilisateur du site web.</p>
<h4>Logiciel de gestion de terminologies et taxonomies</h4>
<p>Ces logiciels (dont ITM de Mondeca) ont pour objectifs de permettre l’édition des taxonomies de navigation, la gestion de leurs différentes versions, leur mise en correspondance avec les référentiels et nomenclatures utilisées pour qualifier les offres et contenus et finalement la publication des taxonomies de navigation à destination du moteur de recherche et du portail de navigation sous un format standardisé comme SKOS ou tout autre format de fichier adapté au moteur de recherche.</p>
<h4>Moteur de recherche</h4>
<p>Le moteur de recherche doit être capable de ré indexer les contenus et les offres en fonction de l’organisation de la taxonomies de navigation en s’appuyant sur la hiérarchie de la taxonomie et les correspondance décrites avec les attributs disponibles sur les contenus et les offres. Le moteur de recherche doit également disposer des fonctionnalités permettant de recalculer dynamiquement le nombre de résultats pour chaque rubrique de la taxonomie, supprimer les rubriques ne correspondant à aucun contenus et remettre ces informations à disposition du site web quasi instantanément.</p>
<p>Le moteur doit également être capable de fournir aux éditeurs du site des informations statistiques sur l’utilisation des taxonomies : par quelles rubriques les utilisateurs commencent leur sélection? Quel est l’enchaînement des sélections de rubriques? Quels mots utilisent-ils pour affiner la recherche en utilisant le plein texte? ... Ces informations seront utilisées par le responsable éditorial et le marketing pour réorganiser et affiner les taxonomies de navigation.</p>
<h4>Interfaces utilisateurs</h4>
<p>Les interfaces utilisateurs dans le portail doivent être capables de présenter les différentes taxonomies sous forme de listes, d'arborescences, de cartes permettant de sélectionner une zone géographique, de widgets permettant la sélection d’une valeur numérique, de calendriers.... Les interfaces doivent permettrent à tout moment de voir les premiers résultats, avoir le nombre de réponse total, avoir un rappel des critères de sélection actifs, pouvoir supprimer certains critères, réinitialiser une nouvelle recherche ou de la sauvegarder pour une visite ultérieure.</p>
<p>Si le graphisme et la mise en page peuvent beaucoup varier d’un site à l’autre, les composants et leur ergonomies sont assez stables et permettent de capitaliser sur des composants logiciels réutilisables d’un projet à l’autre.</p>
<h2>Conclusion</h2>
<p>Les taxonomies de navigation sont tout à la fois un outil de mise en valeur des offres et un service rendus aux utilisateurs. Leur mise en place relève de choix éditoriaux et marketing et peut nécessiter une segmentation par type de clientèle visée. Les taxonomies de navigation sont un outil dynamique au service de l’éditeur et doivent pouvoir évoluer rapidement en fonction de l’évolution des demandes et des attentes des utilisateurs. Un travail de mise en correspondance entre les taxonomies de navigation et les attributs ou métadonnées qui décrivent les offres et les contenus doit toujours être réalisé. L’utilisation de logiciels spécialisés dans la gestion des taxonomies et référentiels, de moteurs de recherche spécialisés dans la recherche par taxonomies et d’interfaces utilisateurs adaptées et ergonomiques sont indispensables pour une gestion souple et évolutive des taxonomies de navigation dans les portails.</p>
]]></content:encoded>
</item>
<item>
<title><![CDATA[L’extension des capacités des moteurs de recherche par l’utilisation de terminologies métier ou comment rendre les moteurs de recherche plus efficaces ?]]></title>
<link>http://mondeca.wordpress.com/2007/10/11/l%e2%80%99extension-des-capacites-des-moteurs-de-recherche-par-l%e2%80%99utilisation-de-terminologies-metier/</link>
<pubDate>Sat, 06 Oct 2007 20:00:06 +0000</pubDate>
<dc:creator>Jean Delahousse</dc:creator>
<guid>http://mondeca.fr.wordpress.com/2007/10/06/l%e2%80%99extension-des-capacites-des-moteurs-de-recherche-par-l%e2%80%99utilisation-de-terminologies-metier/</guid>
<description><![CDATA[Les moteurs de recherche comme outils d’accès à l’information dans les intranets et portails w]]></description>
<content:encoded><![CDATA[<p>Les moteurs de recherche comme outils d’accès à l’information dans les intranets et portails web des entreprises et administrations sont tout à la fois un sujet d’émerveillement et de frustration. Contrairement aux moteurs de recherche généralistes du web, où l'on accepte d'assez bon coeur que face au miracle de disposer en ligne d’autant d’information, un travail d’exploration et de tri soit nécessaire, l’attitude face au moteur de recherche du Ministère des Finances, de la base d’assistance de Microsoft, de SFR, d’Orange ou du moteur de recherche d’un spécialiste du bricolage est tout autre. Le domaine de recherche est fermé, l’information est limitée et nous nous attendons à un service de qualité de la part d’un fournisseur, d’un commerçant ou d’une administration. Bref nous ressortons en général frustré, incapable d'être certain d'avoir localisé toute l'information utile et en général déçu par le peu de soin apporté par l'éditeur à nous apporter une aide au delà d'avoir installé un moteur de recherche sur son site.</p>
<p><!--more--></p>
<p>Les raisons de notre frustration peuvent avoir deux origines cumulatives :</p>
<ul>
<li>L’information que nous cherchons n’est pas en ligne et nous n’avons donc aucune chance de la trouver mais également aucune chance d'être certain qu'elle n'est pas en ligne</li>
<li>Nous ne savons pas comment décrire notre problèmatique pour avoir une chance de trouver le document utile , lui même rédigé avec le vocabulaire métier/jargon de l'entreprise ou de l'administration</li>
</ul>
<p>Nota bene à l'intention des commerciaux des moteurs de recherche : mon problème n'a jamais été de différencier un avocat (profession) d'un avocat (fruit) mais de trouver comment Sony décrit "Une anomalie de synchronisation entre mon ordinateur sous Vista et mon téléphone dont je n'arrive pas à trouver la référence", comment le Ministère des Finances nomme "Les évolutions fiscales pour les PME innovantes dans les textes réglementaires" ou comment e-bay décrit les "nains de jardin" sur son site polonais (et oui...).</p>
<p>Incapable de disposer d’un inventaire complet des contenus disponibles (voir un prochain article traitant des index dans les sites web), nous nous torturons pour effectuer 100 fois la même recherche en imaginant toutes les façons possibles qu’a pu avoir l’entreprise pour en parler (expérience particulièrement frustrante quand on recherche une solution à un problème technique dans une base d’assistance : comment décrire l’anomalie, faut il utiliser le code erreur, le nom du matériel, s’exprimer en anglais, en français ?…).</p>
<p>Le moteur n’est en général pas en cause, il a correctement répertorié tous les mots utilisés, il les a indexé et nous donne en un temps record une longue série de documents. C'est bien l’entreprise qui est en cause pour ne pas avoir donné au moteur de recherche les outils permettant de faire la correspondance entre son jargon / vocabulaire métier et les mots qu’utilisent ses clients ou administrés.</p>
<p>A l’époque ou nous pouvions disposer de l'aide d'un de nos congénères au téléphone ou dans un magasin, et sauf quelques rares cas ou nous avions affaire à des personnages mal intentionnés, nous disposions d’un interlocuteur capable d’interpréter notre question, exprimée avec nos mots, pour la transcrire dans son vocabulaire métier et rechercher alors l’information dont nous avions besoin.</p>
<p>Si les entreprises prennent le soin de former leurs employés au vocabulaire métier et au dialogue avec les clients, elles négligent en général de faire le même travail auprès des moteurs de recherche en leur fournissant leur vocabulaire métier et les correspondances avec les mots que nous avons pour exprimer nos recherches.</p>
<p>Pour les encourager à le faire nous montrerons dans cet article l’apport des terminologies métier à l'efficacité des moteurs de recherche.</p>
<h3>Extension sémantique</h3>
<p>Les moteurs de recherche disposent tous de fonctionnalités plus ou moins avancées « d’extension sémantique » aussi appelées dans le vocabulaire de la gestion documentaire "autopostage" - sous ces termes techniques se cache la capacité des moteurs :</p>
<ul>
<li>de réaliser automatiquement une correspondance entre une expression donnée par l’utilisateur et un ensemble d'expressions équivalentes ou connexes qui ont pu être utilisées dans le document,</li>
<li>de réaliser la recherche en utilisant cette liste étendue d’expressions.</li>
</ul>
<h4>Extension sur les synonymes, acronymes, codes, références</h4>
<p>L’extension sémantique de base est un enrichissement de notre requête en utilisant toutes les expressions équivalentes qu’utilise l’entreprise :</p>
<blockquote>
<ul>
<li>Synonymes</li>
<li>Acronymes</li>
<li>Codes (par exemple pour les codes anomalies variés que nous donnent toutes nos machines)</li>
<li>Référence de l’objet, du produit, du service</li>
<li>Nom commercial du produit</li>
<li>Nom technique utilisé dans les documentations internes</li>
<li>Identifiant du règlement ou texte de loi traitant du sujet (voir les sites de l’administration)</li>
<li>...</li>
</ul>
</blockquote>
<p>Ce type d’extension répond à une très grande partie du besoin car il permet au moteur de retrouver l’ensemble des documents parlant du sujet décrit par l’utilisateur. Elle permet également à l’utilisateur, sous réserve que le site signale qu’il a effectué la recherche en utilisant une série d'expressions équivalentes, de savoir qu’il dispose de l’ensemble des documents disponibles sur le sujet.</p>
<p>Au final l'utilisateur a plusieurs motifs de satisfaction :</p>
<ul>
<li>avec un peu de chance, il a identifé le document recherché,</li>
<li>il a disposé en 1 seconde de tous les documents possibles et donc évité de perdre 10mn à tenter différentes recherches,</li>
<li>il a appris du vocabulaire métier,</li>
<li>il a vu que l'entreprise avait fait un réel effort pour l'assister.</li>
</ul>
<h4>Recherche sur des concepts ou sujets plus précis</h4>
<p>Un second type d’extension sémantique permet d’étendre la recherche à des sujets plus précis que celui décrit par l’utilisateur. Par exemple l’utilisateur cherche tout ce qui est dit sur la réglementation des activités nautiques, il est possible que les réglementations ne traitent pas directement des activités nautiques mais de certaines activités spécifiques comme le canoë, le kayak, l’aviron, la péniche de plaisance, le canyoning… L’extension automatique de la recherche par le moteur permettra à partir de l'expression "activités nautiques" d'étendre la recherche à canoë,  kayak, aviron, péniche de plaisance, canyoning… évitant ainsi à l’utilisateur d’imaginer par lui-même la liste complète des activités nautiques telle que la conçoit l’administration (ou le magasin de sport).<br />
Comme pour l’extension sémantique par des termes équivalents il peut être utile de présenter à l'utilisateur la liste des termes plus précis proposés par l’entreprise. Cela permet de valoriser le service rendu mais aussi de donner à l’utilisateur l’explication du résultat de la recherche à partir de son expression d’origine.</p>
<h4>Cross lingue</h4>
<p>Les entreprises mettent parfois à disposition des contenus multilingues, tout particulièrement en ce qui concerne la documentation technique, la réglementation internationale, l’administration européenne ou les bases d'assistance technique. La recherche cross lingue permet, si l’entreprise ou l’administration ont fournis des traductions de leur terminologie, de traduire l’expression de l’utilisateur dans les différentes langues et d’effectuer la recherche à partir de l’expression dans les différentes langues.<br />
En fonction du contexte, cette fonction peut être automatique ou débrayable par l’utilisateur. Encore une fois cette fonction est un véritable service rendu à l’utilisateur pour lui permettre de disposer en 1 seconde de toute l'information disponible au lieu de tenter des recherches dans chacune des langues dans l'hypothèse ou il saurait quelle expression employer. Par exemple je ne connais pas l'équivalent de "gite rural" en italien, je serais heureux que le site de la région de Toscane me permette de chercher en tapant "Gite Rural" - bien sur je ne pourrai peut être pas comprendre la fiche décrivant le gîte rural mais j'aurai sa photo, son adresse, un e-mail et le prix de la nuit ce qui est un bon début.</p>
<h4>Extension sur des concepts reliés – suggestions de recherche</h4>
<p>Les sujets traités par une entreprise ou administration sont complexes, nombreux et interconnectés. L’utilisateur, le client, le citoyen n’ont pas une connaissance innée des découpages, segmentations, relations faites entre les sujets. C’est un service aux utilisateurs de leur indiquer les sujets connexes au sujet tel qu’ils l’ont exprimé.</p>
<p>Le malade est content de savoir que tel médicament est basée sur telle molécule, est utilisé pour telles maladies et interagit avec tel autre médicament; toutes ces informations lui permettront de continuer d'avancer dans ses recherches et de vérifier qu'il n'y a pas de contre indications dans les médicaments qu'il prend. Ces extensions sémantiques, suggestions, liens de connaissance permettent à l’utilisateur de comprendre l’organisation des sujets traités, des contenus et de guider sa recherche. Dans les sites e-commerce elles permettent aussi de proposer et valoriser d'autres produits et donc de multiplier les ventes (voir Amazon).</p>
<h3>Des extensions sémantiques cachées ou apparentes, automatiques ou à la demande ?</h3>
<p>Le choix de montrer ou de ne pas montrer aux utilisateurs le processus d'extension des recherches dépend beaucoup du type de public (experts, employés, clients et administrés…), du type de service rendu et de la nature des extensions réalisées par le moteur de recherche.</p>
<p>Les extensions sémantiques sur les synonymes, acronymes, références… peuvent souvent être faites systématiquement car elles ne changent pas le sens de la requête de l’utilisateur. Il semble plutôt positif de pouvoir indiquer à l'utilisateur le détail de l'extension réalisée en listant les expressions complémentaires ajoutées à sa recherche, cela valorise le service et permet à l'utilisateur de comprendre le résultat obtenu.</p>
<p>Les extensions sémantiques sur des termes plus précis doivent être signalées aux utilisateurs et pouvoir être débrayées car elles modifient le sens de la requête initiale. Elles peuvent être extrêmement utiles mais aussi augmenter considérablement le volume de résultats contre la volonté de l’utilisateur. L’utilisateur doit pouvoir limiter l’extension de la recherche à certains termes uniquement.</p>
<p>Les extensions sur des sujets reliés ou connexes ne devraient pas être traitées directement par le moteur mais être montrées à l'utilisateur qui gardera le choix de demander une recherche sur ces suggestions.</p>
<h2>Que faut-il fournir aux moteurs de recherche pour disposer de ces services ?</h2>
<p>Les services d’extensions sémantiques des moteurs de recherche dépendent de la richesse des ressources terminologiques qui leur sont fournies et de leur capacité à les utiliser.</p>
<h3>Vocabulaire issus de la terminologie</h3>
<p>Le premier niveau de ressources terminologiques pouvant être fournis au moteur de recherche est un dictionnaire comprenant les mots ou expressions et leurs équivalences (synonymes, acronymes, codes, références…) dans une ou plusieurs langues. Ce type de ressources permettra les extensions sur les expressions équivalentes et la recherche cross lingue.</p>
<h3>Organisation hiérarchique des termes</h3>
<p>Les relations hiérarchiques entre les termes constituent un second niveau de ressources terminologiques. Sur cette base le moteur pourra mettre en œuvre l’extension des recherches vers des concepts plus précis ou suggérer à l’utilisateur des termes pour préciser sa recherche.</p>
<h3>Liens de connaissances, relations sémantiques</h3>
<p>Le troisième niveau de ressources terminologiques (issues d’une base de connaissance ou d’une ontologie) est constitué des liens sémantiques entre des termes (travaille avec... est relié à... est un composant de... est un partenaire...  interagit avec... modifie tel réglementation... peut être la cause du problème... ). Ce type de ressources peut être utilisé pour suggérer des recherches complémentaires à l’utilisateur ou pour réaliser une extension automatique des recherches en utilisant de manière pertinente les liens sémantiques. Les fonctions du moteur relévent alors du domaine du raisonnement automatique et de l'inférence et plus que  du moteur de recherche basé sur l'indexation du texte.</p>
<h3>Comment alimenter les moteurs de recherche ?</h3>
<p>Chaque moteur de recherche dispose aujourd’hui de ses propres formats d’alimentation de ses ressources terminologiques (ou dictionnaires) : fichiers ascii, fichiers xml, fichiers rdf...</p>
<p>Deux types d’évolutions seraient souhaitables de la part des moteurs de recherche et des logiciels de gestion de terminologies :</p>
<ul>
<li>la capacité de synchroniser automatiquement les ressources terminologiques avec le dictionnaire des moteurs de recherche en utilisant les API et ou des web services</li>
<li>la possibilité d'utiliser des formats standards d'échange de fichiers basés sur RDF (SKOS, OWL..) qui permet la description des ressources terminologiques et des différents types de relations entre les termes et les sujets métier.</li>
</ul>
<h2>Quels moteurs de recherche pour disposer de ces services ?</h2>
<p>Les moteurs de recherche n’ont pas tous les mêmes capacités d’exploitation des ressources terminologiques. Les fonctionnalités disponibles doivent être examinées pour chaque moteur : capacité d’utiliser un vocabulaire, une organisation hiérarchique de termes, des liens sémantiques. Certains moteurs disposent en propre de ressources terminologiques généralistes, il faut dans ce cas comprendre comment les ressources terminologiques métier de l’entreprise vont être utilisées (en remplacement, en complément des dictionnaires déjà fournis ?).</p>
<p>Il est également important de détailler les moyens d’import et de mise à jour des ressources linguistiques du moteur : format de fichier utilisé, API, capacité de mises à jour incrémentales ou nécessité de charger toutes les ressources à chaque mise à jour, impact d’une modification des ressources terminologiques sur l’exploitation du moteur de recherche (prise en compte immédiate, besoin de réindexer tous les contenus …).</p>
<p>L’exploitation des liens sémantiques pour apporter des services avancés d’aide à la recherche sont le propre des moteurs basés sur les technologies du web sémantique (RDF, OWL) comme par exemple les logiciels Ontobroker, Sesame, Oracle RDF... Ces logiciels agissent en général en complément d’un moteur basé sur l’indexation texte.</p>
<h2>Quels outils de gestion de terminologies utiliser ?</h2>
<p>Les logiciels de gestion de terminologies multilingues capables de gérer différentes organisations de la terminologie métier (dictionnaires, thésaurus, taxonomies, listes d'autorités...) et conçus pour une alimentation automatisée de systèmes externes ne sont pas nombreux sur le marché. ITM de Mondeca est bien sur une des solutions adaptées à ce besoin. L'application ITM est représentative d'une nouvelle génération d'outils de gestion de terminologies, thésaurus, taxonomies conçue comme des serveurs de terminologies au service de l'ensemble des applications de l'entreprise : moteur de recherche mais aussi text mining, traduction automatisée, classification et annotation des contenus...</p>
<h2>Enrichir et faire évoluer la terminologie entreprise</h2>
<p>L’utilisation de ressources terminologiques pour améliorer les capacités des moteurs de recherche amène deux questions: comment constituer et faire évoluer les ressources terminologiques ? comment les gérer techniquement ?</p>
<h3>Constitution et évolution des ressources terminologiques</h3>
<h4>Récupérer des ressources terminologiques métier existantes</h4>
<p>Il existe toujours dans l’entreprise ou dans son environnement des ressources permettant de démarrer une gestion de terminologie métier. Ce peut être :</p>
<ul>
<li>Un glossaire, thésaurus mise en place par les services de documentation</li>
<li>Un glossaire ou thésaurus mis en place au sein d’instances professionnelles ou dans le cadre de projets de dématérialisation des échanges au sein d'une profession</li>
<li>Les index des documentations techniques papier qui listent les sujets traités</li>
<li>Les tables de références utilisées dans les applications de gestion</li>
<li>Les plans de classement et taxonomies mis en œuvre dans une gestion documentaire ou des intranets</li>
<li>Le contenu des bases de données contenant la description des services, produits, projets, personnes, partenaires, fournisseurs</li>
<li>L’organigramme de la société avec sa liste de filiales, départements, services</li>
<li>Les dictionnaires des traducteurs</li>
<li>...</li>
</ul>
<p>L’ensemble de ces ressources constitue des éléments de base pour démarrer un projet de gestion d'une terminologie dans l’entreprise. Un travail de réingénierie des ressources exisantes est souvent nécessaire et peut impliquer un expert interne ou externe de la gestion de terminologies et thésaurus.</p>
<p>Cette première phase de travail peut être complétée par un travail d’analyse de documents représentatifs (documentation produits, réglementations, contrats, document projet…) pour en extraire le vocabulaire métier et enrichir la terminologie des termes fréquemment utilisés. Des outils spécialisés existent pour assister l'expert dans ce travail.</p>
<h4>Mise à jour automatique ou assistée de la terminologie métier</h4>
<p>La terminologie métier peut être mise à jour automatiquement pour certains types d’information gérée dans des applications : par exemple les noms et références des produits peuvent être mis à jour depuis une application de gestion de catalogue.</p>
<h4>Mise à jour et enrichissement de la terminologie métier de manière collaborative</h4>
<p>La terminologie de l’entreprise est composée de plusieurs sous ensembles dont les procédures de mise à jour peuvent être différenciées.</p>
<blockquote>
<ul>
<li>Les termes décrivant le vocabulaire général d’un métier peuvent être enrichis, mis à jour, traduits dans le cadre d’un travail collaboratif impliquant des correspondants dans l'entreprise et ses filiales : rédacteur techniques, documentalistes, responsables communication, éditeurs de sites intranet et web…</li>
<li>La mise à jour du vocabulaire désignant des projets, produits, partenaires, personnes, entreprises… soit la partie de la terminologie évoluant de manière continue, peut être déléguée à tous les utilisateurs directement impliqués :</li>
</ul>
</blockquote>
<ul>
<li>
<ul>
<li>
<ul>
<li>Proposition d’ajouts de termes ou synonymes dans le cadre d’un travail d’indexation</li>
<li>Proposition d’ajouts dans le cadre d’une recherche où l'utilisateur constate l’absence d’un synonyme ou acronyme dans le dictionnaire du moteur de recherche</li>
</ul>
</li>
</ul>
</li>
</ul>
<p>En fonction du type d’organisation, du type de contenu, du type d’utilisation des référentiels, les mises à jour peuvent être prises en compte directement dans la terminologie métier ou après un processus de validation.</p>
<h4>Examen régulier et attentif des expressions utilisées pour la recherche</h4>
<p>Les expressions choisies par les utilisateurs dans le cadre des recherches sont une source de première main pour guider l’enrichissement de la terminologie métier. Les moteurs de recherche disposent en général d’un historique et de statistiques sur les expressions utilisées pour les recherches. L’entreprise doit veiller à enrichir sa terminologie en ajoutant progressivement ces expressions comme synonymes de termes métier. Ce faisant elle constituera rapidement une terminologie adaptée à ses utilisateurs pour leur plus grande satisfaction (à titre d'exemple, les services des impôts américains ont étudié le vocabulaire utilisé par les administrés pour décrire leurs demandes dans les courriers et lors des échanges avec les centres d'appel. C'est sur la base de ce travail ils ont constitué une terminologie spécifique qui a été mise en relation avec le vocabulaire très technique de l'administration fiscale).</p>
<h2>Conclusion</h2>
<p>Les moteurs de recherche utilisés par les entreprises et administrations pour permettre à leurs employés, clients, administrés, partenaires... d'accéder aux ressources mises en ligne doivent faire un travail de médiation entre le vocabulaire des utilisateurs et le vocabulaire métier de l'entreprise. Pour cela les moteurs doivent constamment être enrichis des vocabulaires spécialisés de l'entreprise, des vocabulaires des utilisateurs et des correspondances entre ces vocabulaires.</p>
]]></content:encoded>
</item>

</channel>
</rss>
