Pratiquer la veille multilingue en 4 étapes et 15 outils linguistiques

Publié le Vendredi 14 Novembre 2008, 12:55 dans Outils par Christophe Deschamps - Lu 4881 fois. Version imprimable

-

Dire que Google Reader permet de faire de la veille multilingue grâce à ses fonctions de traduction automatique c'est une chose, le démontrer c'est mieux. Il ne s'agit en effet pas seulement de récupérer un flux rss dans une langue étrangère et de cliquer sur le bon bouton. Ca c'est la dernière étape :-)
Je vous invite donc à un petit exercice pratique et j'ai choisi à cet effet un thème de veille volontairement complexe et d'actualité : Que dit la presse russe des positions françaises durant et après le sommet UE - Russie?

Sujet compliqué car :

1 : j'ai fait un peu de russe mais c'est tellement loin que je décrypte à peine 50% de l'alphabet cyrillique (et que je comprends à peu près 1% de ces 50% ...)
2 : c'est une langue à déclinaison qui pourrait poser pas mal de problèmes lorsqu'il s'agira de surveiller un mot-clé puisqu'on le retrouvera avec un nombre incalculable de terminaisons. Enfin si calculable mais bon... je n'ai pas vraiment le temps de me replonger dans la grammaire russe actuellement. Ceci nous apprend toutefois une première chose essentielle : lorsque l'on veut faire de la veille dans un langue précise il faut s'intéresser un minimum à sa construction grammaticale : si vous choisissez un mot dans une forme qui n'est jamais utilisée, sinon par les dictionnaires, vous pourriez ne pas avoir de résultat. Heureusement Google News, grâce lui soit rendu, a pensé à tout et propose dans ses résultats les variantes d'un même mot (pluriel/singulier, masculin/féminin, et donc les déclinaisons. Cette possibilité relativement récente et très gênante lorsque l'on recherche un mot précis s'avère ici d'une grande utilité.

Précision : il est évident que cet article ne prétend pas faire le tour de la question. Dans un processus de veille réel, pour une entreprise par exemple, il s'agirait d'une simple phase de démarrage. Sachant que les mots-clés choisis ici seront ensuite optimisés en fonction des résultats obtenus. La veille c'est forcément itératif et personne ne peut prétendre arriver d'emblée avec un système parfait.

1 - Première étape : choisir ses mots-clés.

Il s'agit ici de choisir les mots-clés que vous allez lancer dans les moteurs. Je ne détaillerai toutefois pas cette étape puisqu'elle n'est pas spécifique à la veille multilingue. En deux mots il s'agira par exemple de trouver les synonymes d'un mot-clé ou encore de le préciser par un second mot (ex : intelligence + économique), ou au contraire d'en étendre la portée par des concepts associés (ex : les termes "veille" ou "lobbying" sont très souvent associés à l'expression "intelligence économique").

Notre exemple :  dans notre cas nous nous contenterons du mots-clé "français". Nous partons en effet du principe qu'on pourra le retrouver dans des expressions telles que "le président français" ou "les français pensent que". Le conseil le plus important lorsqu'on fait de la veille sur internet c'est de toujours chercher à se mettre dans la peau de la personne susceptible d'avoir écrit l'article qui nous intéresse afin d'imaginer les mots-clé qu'elle aurait pu utiliser. C'est pas très scientifique ça me direz-vous? Non. La veille c'est 80% d'instinct (je vous renvoie à ma thèse préférée sur le sujet : Explorateurs-chasseurs-cueilleurs du web) et 20% de savoirs-faire.

2 - Deuxième étape : traduire ses mots-clés

Traduire les mots-clés choisis est à première vue facile. Les services de traduction automatique sont en effet légion sur le web. Toutefois le fait qu'ils ne proposent souvent qu'une seule traduction pour un mot est un piège qu'il nous faudra contourner. Nous savons tous en effet qu'un même mot peut avoir de nombreux sens dans une langue : un mousse, une mousse (bière), de la mousse (végétale ou autre). Comment faire le bon choix?
Simple, il va falloir, en plus du traducteur automatique, trouver un dictionnaire de cette langue proposant des définitions traduites dans une autre que vous comprenez, ceci afin de valider le sens de votre traduction.
Euh non, pas si simple en fait mais bon j'ai un peu farfouillé :-)

Services de traduction automatique (pratiques mais insuffisants) :
Dictionnaires de définitions bilingues (très bien mais on y trouve pas toujours les langues dont on a besoin), à privilégier toutefois quand c'est possible :
  • Freelang : série de dictionnaires français - étranger (et inversement) en ligne mais que l'on peut aussi télécharger.
  • Logosdictionary : le meilleur selon moi.
  • PanImages : service de recherche qui traduit directement vos mots-clés après désambiguïsation. Lance votre requête traduite dans Google Images et Flickr. Excellent aussi.
  • Reference translate : uniquement pour l'anglais.
Plugins Firefox :
  • Foxlingo : indispensable barre d'outils, le couteau suisse de la traduction en ligne.
  • Quick translation : indispensable barre d'outils, le couteau suisse de la traduction en ligne (ah tiens je l'ai déjà dit)
Sites de ressources sur la traduction :
Autre solution pour valider le sens d'un mot étranger : ce que j'appelle la validation visuelle, vous allez voir c'est simple : mettons que vous vouliez mener une veille sur le mot "éléphant" dans la presse chinoise (quoi y a pas d'éléphants en Chine et alors? M'étonnerait bien qu'il y en ait pas quelques-uns qui traversent la frontière avec l'Inde de temps à autres), donc je disais :
  1. Vous traduisez le mot "éléphant" dans Google translate et obtenez ceci : 大象
  2. Afin d'être sûr que cet idéogramme ne désigne pas les éléphants de mer ou ceux du parti communiste chinois, vous aller le copier-coller dans Google Images version chinoise. Vous tatonnez un peu pour trouver le bouton "Rechercher"et finissez par obtenir une page de résultats pleine de beaux éléphants (cf. ci-dessous), pas de mer et pas communiste (quoique j'avoue ne pas bien connaître le système politique des éléphants). Voilà, vous êtes maintenant sûr que votre mot est le bon. Evidemment cette méthode fonctionne bien pour les animaux, objets et personnes célèbres, mais beaucoup moins pour les concepts, essayez avec "phénoménologie" pour voir (le pire c'est qu'il y a quand même 12400 résultats, ou comment apprendre la philosophie par l'image  :-).


Notre exemple
: le mot français a été traduit et désambiguïsé avec Logos Dictionnary. Le résultat : "французский" qui doit se lire à peu près "françuski".
Mais ce n'est pas tout. Il va nous falloir préciser un contexte si l'on ne veut pas obtenir tous les articles en russe qui citent le mot "français" (ex: "ce grand écrivain français", "cet incroyable footballeur français", "ce goût typiquement français pour les bonnes choses", "ce fabuleux esprit français que tous les peuples du monde leur envient" ou même "les ravages causés par les éléphants français dans les plaines beauceronnes", etc).
J'ai choisi tout simplement le mot "Nice", ville où se tient ce sommet.
Logos Dictionnary ne proposant pas de traduction je me suis retourné vers Google Translate qui m'a donné "Ницца", c'est-à-dire "Nissa". Je suis ensuite allé taper ce mot dans . Pas de problème, les milliardaires russes sont bien sur les photos.

3 - Troisième étape : lancer sa requête et la mettre sous surveillance

Nous voici maintenant armés de deux mots-clés validés. Il ne reste plus qu'à aller interroger les moteurs qui agrègent la presse russe. Encore faut-il en trouver!

Faisons simple pour l'instant :
  • Google News en russe (forcément) : a priori 400 sources de presse indexées
  • Il est bien sûr possible d'interroger directement des titres de la presse russe en ligne mais les choses se compliquent puisqu'il faut qu'ils proposent un fil Rss correspondant à votre requête. S'il n'y en a pas on peut toujours utiliser un service de type Feedbeater, qui va alors créer un fil rss de toutes pièces, pas parfait mais plusieurs tests ont donné des résultats corrects.
  • Voici tout de même deux services qui vous permettront d'identifier des titres de presse ligne classés par pays.
Après avoir lancé votre requête Французский Ницца dans Google News en russe vous obtenez évidemment les articles dans lesquels se trouvent ces deux mots et vous pouvez utiliser les fonctionnalités avancées pour affiner encore les résultats.
Il va falloir maintenant intégrer le flux RSS de cette requête dans votre Google Reader mais avant cela une dernière chose : par défaut les résultats sont classée par pertinence. Afin de toujours voir apparaître les derniers publiés dans votre agrégateur il est indispensable de les classer par date.
Maintenant seulement vous pouvez intégrer le flux RSS dans Google Reader.


4 - Quatrième étape : traduction des flux RSS

En fait c'est la partie la plus simple puisqu'il ne reste plus qu'une chose à faire : cocher la fonctionnalité "Traduire dans ma langue" pour passer de çà :



à çà :



Résultats de l'expérience :

Evidemment la traduction est loin d'être parfaite mais j'ai lu 3 articles en entier et franchement je pense pouvoir dire que j'en ai saisi la teneur, surtout après avoir lu quelques articles en français sur le sujet afin de mieux comprendre le contexte, et puis entre ça et rien le choix est vite fait.

Un exemple d'article traduit :



Pas mal non?

Est-ce que les articles découverts traitent bien du sujet qui m'intéresse? Oui plutôt, même s'il faut encore faire le tri. Il sera nécessaire d'ajouter des mots-clés pour cerner plus précisément le sujet et également retirer le mot-clé "Nice" rapidement si l'on veut continuer à suivre cette thématique, car le sommet n'a duré en fin de compte qu'une journée et le mot n'apparaîtra bientôt qu'épisodiquement. Si toutefois on souhaite le conserver pour une raison particulière il suffit de garder cette requète telle quelle et d'en créer une seconde l'excluant. Itératif vous disais-je.

Amusez-vous bien :-)

PS : plusieurs lecteurs d'OF m'ont dit avoir bien apprécié le document PDF mis en ligne pour La veille et Twitter. Je réitère donc l'expérience avec ce long billet méthodologique.


Pratiquer la veille multilingue en 4 étapes et 15 outils linguistiques
Get your own at Scribd or explore others: veille Watch

Si vous avez aimé ce billet vous pouvez :

Le promouvoir :



En parler sur Twitter :

Articles portant sur des thèmes similaires :


Commentaires

  1. Lien croisé

    Ecrit par Anonyme, le Vendredi 14 Novembre 2008, 15:00

    Pratiquer la veille multilingue en 4 étapes et 15 outils linguistiques : " Autres actualités de cette journée : 15/11/2008"

  2. veille multilingue -

    Ecrit par Dalb, le Vendredi 14 Novembre 2008, 22:25

    Bonjour. Merci pour ce panorama et démarche.
    Pour les premières étapes, les thésaurus multilingues sont d'excellentes ressources également.
    Par exemple le GEMET (environnement) en 24 langues, dont le russe d'ailleurs :
    http://www.eionet.europa.eu/gemet/index_html?langcode=ru
    Dalb

  3. Re: veille multilingue -

    Ecrit par crid, le Vendredi 14 Novembre 2008, 22:59

    C'est effectivement un outil intéressant, merci de l'avoir partagé.

  4. Lien croisé

    Ecrit par Anonyme, le Samedi 15 Novembre 2008, 07:55

    Intelligence interculturelle | Pratiquer la veille multilingue en 4 étapes et 15 : ">>>  à voir "

  5. Autre service utile

    Ecrit par crid, le Dimanche 16 Novembre 2008, 11:05

    La base de données terminologique multilingue de l'Union Européenne.

  6. Merci pour ces explications détaillées

    Ecrit par Pat, le Mercredi 19 Novembre 2008, 18:07

    Bravo, cet article est un superbe travail bien documenté. Continuez comme cela c'est très utile.

  7. Re: Merci pour ces explications détaillées

    Ecrit par crid, le Vendredi 21 Novembre 2008, 21:05

    Cela fait 5 ans que je "continue comme çà" ;-)

  8. Lien croisé

    Ecrit par Anonyme, le Jeudi 20 Novembre 2008, 17:23

    Flux RSS - Outils Froids : "Envoyer l'articlePratiquer la veille multilingue en 4 étapes et 15 outils linguistiques"

  9. Ecrit par Yléa, le Samedi 22 Novembre 2008, 20:55

    Waouh ! Super grand merci pour cet article !

  10. Re:

    Ecrit par Anonyme, le Mercredi 24 Août 2011, 10:19

    this is so exciting and informative for me really...I have been always a fan of innovation and new things in life so doin these kind of courses like CCNA, MCSE and other 640-816|| 350-030|| 642-832||

  11. Lien croisé

    Ecrit par Anonyme, le Mardi 2 Décembre 2008, 12:46

    Infobulles.ch - Syndication de flux RSS » ! Outils Froids : "  » ‎"

  12. Lien croisé

    Ecrit par Anonyme, le Dimanche 16 Août 2009, 01:13

    Blogs en d'autres langues : Traduction automatique de flux RSS | Cmic Blog : "Outils Froids : Pratiquer la veille multilingue en 4 étapes et 15 outils linguistiques"

  13. Re: Lien croisé

    Ecrit par Anonyme, le Mercredi 24 Août 2011, 10:20

    The post is written in very a good manner and it entails much useful information for me. I am happy to find your distinguished way of writing the post.
    350-018||
    640-864||
    646-364||

  14. Lien croisé

    Ecrit par Anonyme, le Mercredi 4 Novembre 2009, 12:52

    La vie multilingue des mots sur le web (projet n°1 plurital) : " (sur le site "Outils Froids") : Pratiquer la veille multilingue en 4 étapes et 15 outils linguistiques ."

  15. Lien croisé

    Ecrit par Anonyme, le Jeudi 13 Mai 2010, 11:50

    Discover From Your Favorite Topic or Web Page: traduction russe : " [Discover] OF - Pratiquer la veille multilingue en 4 étapes et 15 outils linguistiques http://www.outilsfroids.net/news/pratiquer-la-veille-multilingue-en-4-etapes-et-15-outils-linguistiq ..."

  16. Lien croisé

    Ecrit par Anonyme, le Jeudi 9 Décembre 2010, 22:36

    Un chargé de veille investit les réseaux sociaux « Chronique d'un cha : "e pose la difficulté de la langue, voire de son écriture. Cette problématique de la veille en plusieurs langues a provoqué l’émergence d’une nouvelle fonction chez les traducteurs, antérieurement confinés à la transmission de messages. Mais tous les chargés de veille ne maîtrisent pas des langues rares. Cela à conduit à enrichir le processus de veille et les outils utilisés. Des enrichissements que j’ai utilisé avec profit pour réaliser un audit d’opinion sur une entreprise de distribution implantée sur trois continents."

Nuage de mots-clés des articles