Dixio, le dictionnaire à portée de clic

J’ai ressenti comme des prémices (clic-clic) de frissons en découvrant la présence du dictionnaire Dixio en sous-sur-couche (clic-clic) des pages des sites des quotidiens espagnols La Razon et El Economista. De quoi, les frissons ? Prémisses (clic-clic) d’arguments augurant de la satisfaction de constater qu’un jour, le vocabulaire appauvri de la presse quotidienne se renchérira de vocables (clic-clic) à présent bannis de la prose rendue digeste au forceps (clic-clic) ? Ou pressentiment qu’un outil mal employé va reléguer les dictionnaires imprimés au rencart (à l’encan pour les bibliophiles) et clouter les copies des collégiens, lycéens et étudiants de faux et contresens ? Vite, un carminatif (clic-clic) pour me purger des flatulences verbeuses que le sujet m’inspire…

À bon chat, bon rat, et à bon cuistre bon(ne) quoi ? Suisse (clic-clic), correctrice ? Deux-trois remarques préliminaires… Bientôt le triple clic ou une commande pour déclencher, en mode fenêtre contextuelle, un dictionnaire de rimes ? Bon courage avec « cuistre ». Je ne sais si le traducteur Google – activé, rester le curseur sur un mot d’une page HTML le fait surgir – saurait le traduire en diverses langues mais je viens de constater que, pour Atlas (nom  propre, dans le contexte, celui d’un accélérateur de particules), il calait.
De même, le résultat pour “tense” (dans la suite ang. verbal tense, soit temps de conjugaison) équivalait à « néant ».

Par ailleurs, si Le Grand Robert électronique s’en tire bien avec « suisse » (mercenaire, portier, bedeau), ce dictionnaire de langue si prisé comporte tant de lacunes, en particulier pour les sens figurés (dont les fautifs courants), qu’il ne peut dispenser d’en consulter d’autres (Littré, Larousse…).

Comment donc se comportera Dixio, disponible à présent en anglais et espagnol dans l’attente d’autres langues, dont le français ? S’agit-il vraiment d’un « dictionnaire contextuel » se fondant (« se basant » reste un anglicisme) sur une analyse sémantique autant que morphosyntaxique ?

La polysémie d’un mot aussi simple que « temps », même dans son acception grammaticale, rend particulièrement complexe son interprétation par des algorithmes. Mais que le traducteur de Google ne puisse trouver un équivalent pour tense – de même, mais pour des raisons autres et similaires, que Le Grand dictionnaire terminologique de l’Office québécois de la langue française –, surtout précédé de verbal, vous donne une idée de « l’état de l’art » comme on vient à employer cette locution à tort et à travers.

Ardue et complexe

« Fort » d’une formation en traitement du langage naturel et en dictionnairique dont j’ai tout oublié hormis les rudiments, j’ignore à présent l’état d’avancée de ces disciplines ; je subodore encore subrepticement (ici, furtivement) que ce n’est pas de la tarte de concevoir un Dixio.

Où en est l’analyse sémantique contextuelle en général, j’ignore, mais pour la grammaticale (morphosyntaxique), j’imagine que c’est au point… généralement, donc, partant, dans Dixio.

Fight the Fog était un programme du Bureau de la traduction de la Commission européenne visant à expurger des textes officiels le jargon, voire à l’éradiquer. Croyez-m’en – expression parfaitement correcte que me souligne en rouge le lexique de MSWord – c’est coton ! Déterminer  non pas une, mais la signification, en fonction de son « double » sens (séquentiel, intelligible), d’un mot dans une phrase, même assez simple, cela ne tombe pas non plus sous le sens.

Court soulagement

Dixio fonctionne plutôt bien : vous cliquez deux fois sur un mot, et une définition de base empruntée à un dictionnaire s’affiche, suivie de diverses autres concoctée par les équipes de Semantix, son éditeur, puis de fiches Wikipedia. C’est le cas général. Pour les noms propres, c’est selon. Higgs vous renvoie à l’entrée « boson de Higgs » de Wikipedia. Je ne sais quels algorithmes lâches ou flous sont employés, quel est le taux de réussite d’interprétation, mais cela représente sans doute une avancée.

Cela laisse envisager que la presse pourrait faire un usage moins basique du vocabulaire. Nous en sommes à présent à ne plus utiliser qu’un lexique accessible à l’écolier du niveau du brevet des écoles, ce non plus seulement en presse quotidienne régionale généraliste. Cela n’empêche pas de petits malins et de petites facétieuses n’ayant pas bénéficié des soins d’un secrétariat de rédaction prompt à n’user que des synonymes les plus simples (donc, parfois, ambigus, réducteurs) de s’emmêler grave les pinceaux en employant soit « prémices », soit « prémisses », parfois dans la plus grande confusion. Lu récemment dans Le Point : « prémisses de dialogue »… ce qui pourrait se concevoir, mais là employé au sens de « prémices » (d’une éruption, d’une crise, d’un événement).

Pour simplifier ce que peut apporter l’analyse sémantique, mettons que si j’avais écrit « relégué au rencard » (après tout, on pourrait l’être, si ce rendez-vous était qualifié de furtif, ou hâtif), elle m’aurait indiqué que « rencart » était le vocable idoine. Cette analyse, qui gagne à s’appuyer aussi sur la linguistique dite énonciative (permettant de décrypter que « épinards, beurk ! » signifie ce que la structuraliste conçoit si un verbe tel « détester » est employé), fonctionne assez bien avec des textes à peu près normalisés (documentation technique, presse généraliste, littérature de gare…).

Il n’est pas sûr qu’elle soit déjà susceptible de déceler que « mettre à l’encan », qui ne veut pas tout à fait signifier placer au placard, voire galvauder, s’en approche tant ce sens dérivé tend à s’instaurer, en le dérivant de « brader » ou « sacrifier », « liquider ». Mais le Centre national de ressources textuelles et lexicales (CNRTL) n’admet pour le moment, par extension, que le sens dérivé « faire trafic de ». Les lexicographes se hâtent lentement.

Pour vous donner une idée, le CNRTL met à disposition trois années complètes de publication de L’Est Républicain, d’autres centres disposent de celui, plus imagé, présumerai-je, du Canard enchaîné. Ce afin de se livrer à de complexes opérations de calcul, de recherche des occurrences, de détection de néologismes latents, d’élaboration des bases de connaissances lexicales.

En dépit des progrès indéniables, je serais ébaubi (fort) que le journaleux de base se remette à employer « abalobé » (plus faible : comme « élerlobé » ou « aberlobé », synonyme d’étonné, voire ébahi, ce dernier étant plus proche d’ébaubi, mais légèrement en-deçà), confiant que Dixio explicitera cet adjectif très peu usité, car progressivement obsolète.

Mais sait-on jamais ? Pourquoi de tels dictionnaires ne pourraient-ils pas contribuer à restaurer une richesse langagière rendue plus accessible à tout un chacun ? Je pressens que nous en restons encore loin. Les écueils plus proches me semblent l’emporter.

Néfaste immédiateté ?

J’avais autrefois titré que l’écrivain Pierre Guyotat, réputé « difficile », faisait « saillie dans la langue » (sous-entendu « française »). Je ne comment ce fut reçu, diversement sans doute. Platement ou non. Je l’entendais au moins double (comme dans l’expression anglaise double-entendre que Reverso réduit à « calembour »). Je ne sais si ce titre a ou non été repris hors contexte d’origine, mais je frémis en imaginant un lycéen double-cliquant sur « saillie », consultant Dixio, puis effectuant des recherches trop rapides via la Toile, pour conclure dans une copie, citation à l’appui de ce titre transposé dans un autre texte, que Guyotat… (je vous laisse imaginer, sachant que cet auteur emploie une langue très crue et traite, comme le relevait Nathalie Crom dans Télérama, des « apprentissages étroitement liés de la sexualité et de l’écriture »).

Je me suis tôt plongé dans les dictionnaires imprimés, et j’y replonge encore, consultant à l’occasion des éditions antérieures d’un même ouvrage. Cela m’a prédisposé à la pratique du « surf » (de la navigation en ligne). Raisonnée, veux-je croire. Il m’arrivait de passer d’un mot à un autre, soit très proche (dans la double page), soit fort éloigné (en signification, et dans un tout autre volume). C’est ainsi que j’ai considérablement enrichi mon vocabulaire qui à présent s’étiole, sous les coups de la pratique du journalisme conforme, puis, tout bêtement, de l’âge, de la négligence, des oublis.

Je ne doute pas que la majorité des khâgneuses et des jeunes érudits sauront faire un bon usage de Dixio et de ses émules ou concurrents. Mais je m’inquiète des autres, même celles et ceux visant des mastères. Appréhension infondée ? Possiblement. Mais ressentie.

L’étudiant sous pression (surtout s’il a décidé de se mettre au dernier moment à rédiger un devoir) va-t-il dérouler l’interface de Dixio ? Ou se contenter de l’affichage du premier paragraphe ? Certes, l’hypertextualité incite au clic pour accéder à des définitions de termes de domaines très voisins.

Mais pour CMS, dans sa page même de démonstration (un article d’El Economista traitant des expériences du Cern), Dixio affiche la page Wikipedia pour le Sistema de gestion de contenidos (équiv. Français d’un SGC).

Pour le Cern, CMS signifie SCM ou « solénoïde compact pour muons ». Nous sommes loin des SGC, à mille lieues de l’informatique, des bases de données relationnelles ou non, la relation pointant sur un détecteur « construit autour d’un énorme aimant », une bobine supraconductrice.

Qu’en serait-il si l’article ou le texte était tout autre que la page de démonstration utilisée par Semantix sur son site (accédé ce jour) ?

Dixio est disponible en versions adaptées pour des liseuses, des tablettes, et des sites. Intégrer divers glossaires et des pages de Wikipedia (référence généralement suffisante, mais pas toujours, loin de là), c’est une bonne idée. La version française pour liseuses (c’est disponible en ang., esp. et catalan) inclura les entrées de « plus de cent dictionnaires », soit plus de « 23 millions de mots ». On pourra adjoindre des dictionnaires ou encyclopédies supplémentaires (selon accords commerciaux), bilingues éventuellement. La Fnac, en Espagne, en munit déjà sa liseuse e-reader. Attendez-vous à le voir (ou des applications dérivées ou similaires) proliférer.

« Dixio Destop et Dixio Web, deux solutions éducatives infaillibles », proclame un slogan. Mais les utilisateurs sont faillibles. Ils sont déjà mis au défi d’interpréter l’envahissant « improbable », employé désormais à toutes les sauces, pour le moins encore plus étranges et insolites qu’invraisemblables. Si ce n’était qu’un idiotisme (pour « incertain » en ang.), ce serait un moindre mal.

Pour et contre

Sur une page de La Razon, Dixio permet de déceler la forme douteuse contararán (éventuellement dérivée d’idiomes sud ou centraméricains ?) et propose heureusement un synonyme castillan tout à fait convenable en fonction du contexte (heureux hasard, dérivé de la morphologie, ou opportune analyse de proximité sémantique ? Allez savoir…).  Je doute fort que les locuteurs d’Espagne aient éprouvé le besoin de cliquer sur cette conjugaison « improbable », mais Dixio a le mérite de la pointer.

C’est en tout cas une aide précieuse à l’apprentissage ou la compréhension de l’espagnol pour les allophones. Au-delà, cet outil peut sans doute engendrer des effets pervers.

Quels seront-ils au juste ? Sans doute voisins de ceux dérivés d’une confiance absolue dans les propositions des correcteurs orthographiques et grammaticaux des logiciels de traitement de texte ou de mise en pages. Mais un dictionnaire prend valeur de référent, d’autorité, ce que les propositions du traducteur de Google n’égalent pas.
On sera plus enclin à s’y fier… à tort, parfois.

En revanche, l’état actuel est encore plus insatisfaisant. La plupart des gens s’attardant sur un mot rencontré en ligne qu’ils ne connaissent pas l’entrent tout simplement en requête Google. Ce qui peut conduire à pire confusion encore que la consultation d’un dictionnaire intégré. De même, quand il s’agit de traduire un terme inconnu d’une langue censée être pratiquée, beaucoup s’en remettent à un bilingue en ligne sans prendre la peine de consulter la définition dans la langue source (via un dictionnaire unlingue).

Sans doute convient-il d’en avoir, comme de tout dictionnaire, une approche pragmatique (au fait, pragmatic est le mot le plus consulté, depuis juin dernier, sur le Merriam-Webster en ligne : la presse américaine aurait-elle délaissé practical pour pragmatic, plus précis, après… avoir adopté Dixio pour les éditions électroniques ?). Mais aussi non exclusive.

Les éducateurs – moins formés en France à présent à de parfois fumeuses théories psychologisantes et fort peu didactiques – gagneraient sans doute à savoir (ré)apprendre à se servir des dictionnaires imprimés et en ligne. En soi, les électroniques ne sont pas inférieurs aux imprimés. Mais ils n’offrent pas la possibilité de s’arrêter sur divers mots de pages précédentes ou suivantes à celle du mot recherché en feuilletant. Avec ceux résidents (sur disque dur), la plupart du temps, une liste s’affiche, ce qui, par exemple, vous offre la possibilité de découvrir « approbaniste » ou « appropriage » si vous recherchiez les sens exact d’« appropriable ». Avec des clics sur des mots existants, ce plaisir, car c’en est un, vous reste inaccessible.

À défaut, ayant consulté Dixio, d’avoir un dictionnaire à portée de main (et non pas de curseur), pensez peut-être, à la première occasion, d’en ouvrir (et non afficher) un autre. Le bon usage de tout dictionnaire ne se conçoit pas isolément, mais confronté à ses alternatives et concurrents.

Auteur/autrice : Jef Tombeur

Longtemps "jack of all trades", toujours grand voyageur. Réside principalement à Paris (Xe), fréquemment ailleurs (à présent, en Europe seulement). A pratiqué le journalisme plus de sept lustres (toutes périodicités, tous postes en presse écrite), la traduction (ang.>fr. ; presse, littérature, docs techs), le transport routier (intl. et France), l'enseignement (typo, PAO, journalisme)... Congru en typo, féru d'orthotypographie. Blague favorite : – et on t'a dit que c'était drôle ? Eh bien, on t'aura menti !

Une réflexion sur « Dixio, le dictionnaire à portée de clic »

  1. Faire « [i]saillie dans la langue[/i] »…

    A rapprocher de l’affirmation de Frédéric Dard : « [i]On a le droit de violer la langue française, à la seule condition de lui faire de beaux enfants[/i] » ?

Les commentaires sont fermés.