Fév. 10 01

Version imprimable Microsoft Academic Search, une intéressante alternative à Google Scholar


-

En rédigeant le mois dernier un article sur Entitycube (excellent moteur de recherche basée sur la détection d'entités nommées proposé en bêta par Microsoft), pour La Lettre Recherche & Référencement d'Abondance, je suis tombé sur Microsoft Academic Search, un moteur développé par la même équipe chinoise.
Egalement en bêta, ce moteur indexe tout de même 5 millions d'articles. Il peut évidemment être interrogé en plein texte mais permet aussi une recherche par auteur, conférence, revue et date. On peut alors croiser l'ensemble de ces critères. L'innovation principale de ce moteur repose sur la détection d'entités nommées qui lui permet de détecter automatiquement ces mêmes éléments.
A noter qu'il existe un langage d'interrogation structuré que nous n'avons pas testé en détail et qui semble permettre d'effectuer des requêtes avancées. Il est décrit dans cette page (un peu après le milieu)
La page de résultats par défaut présente le nombre de citations d'un article et propose un lien supplémentaire lorsqu'il est téléchargeable gratuitement. 



On voit qu'elle propose par ailleurs 3 autres onglets qui valent la peine d'être explorés :

Author : donne évidemment la liste des auteurs cités mais fait bien plus lorsqu'on clique sur l'un d'eux.



Comme vous pouvez le voir le moteur présente une fiche personnalisée dans laquelle on trouve :
  • différents indicateurs sur les citations de cet auteur
  • un graphique présentant la courbe des publications de l'auteur dans le temps ainsi que la courbe des citations.
  • l'université/laboratoire où il travaille
  • tous ses articles (ceux indexés par le moteur évidemment)
  • toutes les citations indexées
  • les co-auteurs de ses articles
Il est possible de classer les articles d'un auteur par date de publication, citations et rank, un indice spécifique à ce moteur. 
Un explorateur visuel permet normalement d'explorer le réseau de co-auteurs d'un auteur mais il ne fonctionne pas actuellement.

Conference : permet de retrouver des présentations données lors de conférences

Journal : permet d'accéder aux revues scientifiques dans lesquels sont parus les articles correspondants à vos mots-clés.

Il est dommage que l'application de cartographie automatique ne fonctionne pas mais on voit que, par sa capacité à enrichir intelligemment les résultats et à créer des liens entre éléments, la détection d'entités nommées a beaucoup à apporter à la recherche d'informations. Un outil à suivre donc ... et à utiliser.


Jan. 10 11

Version imprimable Comment mettre en place une veille d'actualité audio et vidéo?


-

Depuis quelques années la veille sur l'actualité de la presse écrite est largement facilitée par les flux RSS proposés par des portails comme Google Actus ou Yahoo! News. Il reste toutefois un énorme champ à investir qui est celui des actualités diffusées sous forme audio et vidéo. Comment être informé qu'un reportage sur votre concurrent a été diffusé sur une radio? Comment savoir si on a parlé de votre produit au journal télévisé?
Je ne parle pas ici de surveiller des mots-clés dans les titres ou résumés des actualités, ce qui est relativement aisé avec un bon moteur de recherche de vidéos. Non, je parle ide surveiller ce qui se dit durant les journaux télévisés ou radiodiffusés, du contenu plein-texte donc. Pour cela nous allons avoir besoin de moteurs de recherche qui font ce travail d'indexation de fichiers audios, c'est à dire qui disposent de logiciels leur permettant de retranscrire textuellement du contenu audio, ce qu'on appelle du "speech to text".

Je ne vais pas vous mentir, les solutions sont peu nombreuses : soit on achète une prestation en ce sens, soit on arrive à le faire "artisanalement" et c'est bien sûr ce que nous allons voir maintenant. Pour info l'excellent Podzinger/Everyzing faisait cela très bien mais il s'est transformé en plateforme d'entreprise payante.

Nous avons identifié trois moteurs de recherche audio/video disposant de la technologie "text to speech" et nous allons maintenant voir comment les mettre sous surveillance.

Blinkx vous simplifie la tâche

Le plus simple d'usage est sans conteste Blinkx. Ce moteur indexe le contenu de milliers de vidéos et génère des flus Rss par mots-clés. Deux choses à prendre en compte toutefois avant de se lancer :

  1. Par défaut Blinkx lance la recherche dans l'ensemble de ses catégories. Vous risquez donc d'avoir des résultats provenant des catégories TV shows, fitness ou travel. Pour éviter cela il est nécessaire d'utiliser l'opérateur "channel". Exemple : avec le terme "intelligence"
    1. channel:news intelligence 
  2. Ne pas oublier de classer les résultats par date (par défaut ils sont classés par pertinence).
Blinkx est très pratique mais ses sources sont essentiellement anglophones.



Le flux RSS de Blinkx dans Google Reader

Voxalead, le plus puissant


Les labs d'Exalead nous gratifient d'un magnifique outil, Voxalead, qui non seulement dispose de sources françaises (France 24, LCI et M6) mais peut aussi transcrire de l'anglais et, beaucoup plus rare, du chinois ou de l'arabe. Voxalead à par ailleurs le bon goût de donner le texte entier de la transcription, ce qui peut permettre de la traduire via Google. 
Seul problème, il ne génère pas de flux Rss. C'est donc là qu'un peu de bricolage va être nécessaire pour en créer un. J'ai décidé d'utiliser pour cela Dapper, un service d'aide au scrapping à la fois simple à utiliser et puissant. Je ne vais pas expliquer comment faire, d'abord parce que, comme je viens de le dire, c'est simple et d'autre part parce qu'il y a des vidéos qui le font très bien par ici. Sachez par contre qu'au moment de cliquer sur les éléments à mettre sous surveillance le mieux est de sélectionner la première vidéo comme ceci.



Dapper détecte tous les autres objets similaires dans la page, c'est à dire les fichiers vidéos et uniquement cela, pas de pollution donc dans votre flux Rss.

J'ai par ailleurs effectué les mêmes tests sur la langue chinoise en utilisant les techniques de veille multilingue décrites fin 2008 dans ce billet Pratiquer la veille multilingue en 4 étapes et 15 outils linguistiques. Pour cela il faut bien sûr utiliser les fonctionnalités de traduction automatique de Google Reader. Les résultats sont corrects et permettent de mettre en place un premier niveau d'alerte. Je n'ai pas fait le test pour la langue arabe mais il n'y a pas de raison que ce soit plus mauvais (y en a t-il?).

PBS pour compléter

PBS est une chaîne d'information publique américaine qui propose l'ensemble de son contenu indexé. Le moteur de PBS est assez basique mais fonctionne bien. Sa mise sous surveillance via Dapper n'a pas posé de problèmes. 
Il existe une autre chaîne publique américaine qui propose la même fonctionnalité en plus avancée sur son site, il s'agit de C-Span et de son portail C-Span Video Library. Nous n'avons toutefois pas pu mettre la requête sous surveillance (pour l'instant). 

Comme vous le voyez l'offre est pour l'instant assez limitée, tout du moins pour la langue française. Voxalead propose tout de même France 24, LCI et M6. Il serait toutefois étonnant de ne pas voir arriver de nouveaux acteurs dans les mois à venir. Google avait d'ailleurs déjà montré ses velléités avec l'excellent portail Gaudi (Google Audio Indexing), pour l'instant réservé aux déclarations des hommes politiques américains, mais pour combien de temps?


Jan. 10 06

Version imprimable Springer lance le moteur de recherche d'articles scientifiques Exemplar




L'éditeur scientifique Springer, un acteur majeur de ce domaine, semble ne pas vouloir se laisser dépasser par les évolutions technologiques. Après avoir lancé Authormapper, un excellent moteur de recherche permettant notamment de positionner les équipes de recherche sur une carte du monde et de tirer de nombreuses statistiques de ces bases (histogramme de publication par mots-clés, pays, institutions, auteurs, journaux, mots-clés,...) il lance maintenant Exemplar.

Ce second moteur propose à peu de choses près les fonctionnalités statistiques et graphique que le précédent (hormis la localisation géographique) mais se focalise sur la mise en contexte des mots-clés recherchés, présentant à chaque fois la phrase dont ils sont extraits et affichant une image de la revue au passage de la souris. 
A noter qu'Exemplar propose un filtre qui permet de n'obtenir que les articles en open access (et de trouver 24 articles consacrés à la competitive intelligence directement téléchargeables :-) mais qui marchent pas :-(

Les deux moteurs ne fonctionnent pas sur les mêmes parties de la base Springer car ils ne donnent pas le même nombre de résultats pour un même mot-clé.


Jan. 10 05

Version imprimable Et la veille continue de faire son nid...




Sébastien Fanget, qui est photographe, a publié ce matin un billet expliquant en quoi la veille lui est utile dans son métier. Dans une première partie il explique qu'elle l'aide pour : 

- l’amélioration des compétences techniques (articles techniques, tutoriels, vidéos, …)
- la recherche d’inspiration (suivi de photostreams de photographes apprécié(e)s, suivi d’autres centres d’intérêts et/ou d’autres formes d’arts, …)
- le suivi de l’actualité technologique (nouveaux matériels et leurs critiques, nouveaux accessoires et autres « gadgets », …)
- le suivi du monde de la Photo (expositions, interviews/présentations de photographes, …)
comment il la pratique.


Il détaille ensuite la méthodologie qu'il utilise, à base de flux RSS bien sûr, de Google Reader, d'Evernote et de Toodledo.
C'est intéressant et didactique et c'est une preuve de plus (s'il en fallait encore) que la veille est utile à tous et que son utilisation est de moins en moins l'apanage des veilleurs et documentalistes (--> CQFD).


Déc. 09 14

Version imprimable Une formation à la cartographie stratégique et décisionnelle




ICC Formation (émanation de Veille Mag) annonce un stage en février qui devrait être particulièrement intéressant pour qui s'intéresse à l'information grise (c'est à dire normalement tout veilleur d'entreprise). Il est intitulé "Cartographie stratégique et décisionnelle" et est animé par Bertrand Charles, ancien journaliste d'investigation chez Intelligence Online. Voici l'alléchant programme proposé :

Les enjeux de la cartographie stratégique en environnement complexe
Le spectre classique de l’intelligence stratégique (IS) : axes concurrentiels,
technologiques, réglementaires, commerciaux, géographiques, géopolitiques,
sociétaux
Le nouveau paradigme de la veille systémique et structurale
La cartographie d’acteurs, une approche pragmatique et opérationnelle
de l’intelligence stratégique.
Le point sur les outils de cartographie d’acteurs

Identifier les acteurs influant sur vos projets
“Quel acteur / quel enjeu” : la définition des projets stratégiques
Maitriser votre chaine de valeur, votre premier réseau d’acteur sensible (exercice pratique)
Nouveau paradigme de la gestion de la concurrence (chaines de valeurs intégrées, coopétitives, réseaux de valeurs modulaires)
A chaque projet son environnement d’acteurs spécifique : situation interactive,
identification des catégories d’acteurs susceptibles d’influer sur des projets
Key Opinion Leader, Key Decision Makers, “acteurs-clés de succès”

Le rôle clé de l’influence dans les grands contrats
Les différentes formes et leviers de l’influence
Les limites de l’influence normative
Bâtir et sécuriser votre dispositif d’influence
La maîtrise des réseaux d’alliance et des circuits décisionnels
Les stratégies croisées, conjointes et les effets de systèmes
Etudes de cas sur des grands contrats internationaux (étude de dispositifs concurrentiels et de dispositifs d’influences)

Méthode pour dresser une cartographie “projet”
Le ciblage par projet : mettre des sources en face de vos cibles
Les sources d’information : sources ouvertes et sources humaines.
Cartographier vos réseaux internes et externes ; gérer les sources

Exercice de synthèse :

Un cas pratique pour restituer et assimiler les savoirs

Briefing : présentation de l’acteur et de l’enjeu stratégique
Les participants, à partir d’un dossier de presse fourni, doivent identifier et cartographier le système d’acteur d’un de leur concurrent fictif sur un appel d’offre international.
Ils exploiteront les sources fournies et identifieront les zones d’ombre nécessitant
l’activation d’un réseau de sources humaines. Les participants sont invités
à élaborer des stratégies à partir de la cartographie dressée.
Débriefing : chaque participant présente ses conclusions.

Plus d'infos ici.


Déc. 09 06

Version imprimable Astuce de veilleur : Gmail + Google Alerts pour créer des bases de connaissances personnelles automatiquement


 OutilsVeille

J'utilise Google Alerts et GMail d'une manière qui me fais gagner pas mal de temps je crois. En effet, lorsque je sais que je vais devoir traiter d'un sujet à plus ou moins long terme je vais immédiatement créer quelques alertes Google à ce sujet.
Lorsqu'elles arrivent dans ma boîte Gmail je les labellise automatiquement puis les laisse se stocker gentiment. Au moment où je dois "produire l'effort" (support de formation, article, ...) je n'ai plus qu'à exploiter cette base d'informations en devenir, soit en ouvrant mes emails, soit en l'interrogeant grâce au très bon moteur de recherche de Gmail.
On peut évidemment faire de même avec n'importe quel système d'alerte et n'importe quel service/client de messagerie ou agrégateur RSS (dès lors qu'il archives les flux évidemment).
Le procédé n'a rien de révolutionnaire vous l'aurez compris. L'idée ici est plutôt d'anticiper les questions à venir et de commencer à récolter des informations plus ou moins pertinentes (en fonction de la précision de vos requêtes sur Google).

MàJ : précisons aussi qu'il ne s'agit pas vraiment de veille, juste d'un moyen efficace et simple ) mettre en oeuvre pour se constituer une base documentaire sur n'importe quel sujet.


Nov. 09 19

Version imprimable Iceberg intelligence économique n° 11 : du 09/11/2009 au 20/11/2009 (8 éléments)




Léger Iceberg intelligence économique de fin de semaine :

  • Aux Etats-Unis, l'existence d'un cluster est en général associée à la création de start-ups issues de la recherche scientifique universitaire ou de laboratoires de recherche. Pour permettre cette création de richesse, les établissements d'enseignement supérieur d'une région donnée doivent avant tout disposer de solides opérations de transferts de technologie.

  • Belle liste d'outils SEO pour analyser les actions de ses concurrents en ligne.

    • With the acquisition of Admob, Google now has access to usage data of many of the most popular mobile apps -- especially the apps in the iTunes App Store. For iPhones. If Google is taking on Apple for mobile OS market share, it just scored a huge competitive advantage. Google will know more details than ever about how people are using iPhone apps, how they are engaging with advertising within those apps, and users' loyalty to those apps.
  • Un livre consacré à la Darpa vient de sortir.

    • Remarkably, DARPA doesn't own any of these labs. Its minimally bureaucratic three-level chain of command has gone essentially unchanged over the years. It works like this: the agency's director recruits a small staff of specialist programme managers to dream up far-fetched future technologies; the programme managers invite applications from engineers; the winning contractors frantically work to get results in the tight requisite time-frame of three to five years.
    • "The best DARPA programme managers, I swear, are science fiction writers."
    • A programme manager working on the robotic trauma-theatre tells Belfiore he got ideas for projects from sci-fi he had read in his 1950s childhood, and invited contemporary sci-fi writers to give seminars to help inspire DARPA engineers.
    • although he does refer to the "considerable amounts" spent on psychic spying in the 1970s.
    • Belfiore does a good job of exploring the sunny side of the moon that is DARPA, but we still don't know what's lurking on the dark side.
  • Traduction par Antoine Leroux d'un texte paru dans le Search Engine Journal

  • Article intéressant sur les signaux faibles et pourquoi nous ne leur accordons pas plus d'attention.

      • Wohlstetter, then a history professor at Stanford, devotes most of the book to exploring in detail the myriad warning signals that preceded the event. A great many of these clues were made possible by the fact that the US had previously broken the Japanese diplomatic codes. They included:

        • The November 1941 breakdown in negotiations regarding the oil embargo of Japan that the US had initiated four months earlier
        • An abrupt and massive change in Japanese codes and call signals in the early days of December 1941, including the required burning of all confidential and secret documents in embassies around the world
        • Unusual movements of Japanese submarines near Pearl Harbor in the days and weeks before the attack
  • Ne pas mettre la charrue avant les boeufs. Le software arrive après.

    • My advice for insurance companies, brokers and advisors is to wait until your function is well underway so that you build or purchase a tool that supports the process and infrastructure you've established to support your intelligence needs.
    • It is helpful to review and leverage software that is currently utilized within your firm. Examples of software that can be tapped into for intelligence purposes can include tools that manage the sales process, trip reports to distributors and/or insurers and CRM.
  • Le traitement sémantique de l'information en appui à l'informatique décisionnelle (BI) pour tester des hypothèses et explorer des scénarios.


Nov. 09 15

Version imprimable Capt, un plugin gratuit de capture de contenu pour Mind Manager


- -  OutilsMindMapping

J'attire votre attention sur Capt, de la société française Noétika. Il s'agit d'une petite extension pour Mind Manager 6 et 7 extrêmement pratique lorsque vous voulez intégrer des images, photos, schémas, etc.
Elle reste en effet en haut de votre écran et vous permet d'un simple clic de délimiter la partie d'écran que vous voulez capturer avant de l'envoyer directement dans la carte déjà ouverte.



Je parle de cette fonction qui qui est celle que j'utilise le plus mais Capt permet également de capturer du texte dans un document ou même du texte libre pour jeter des idées au fil de l'eau. Un menu déroulant permet de choisir la carte vers laquelle vous voulez diriger la capture ou le texte.
Ainsi vous pouvez lire un article et capturer à la volée dans une carte les éléments qui vous intéressent avant de les réorganiser à votre convenance.
Une appli dont le design n'est sans doute pas très web 2.0 mais qui montre une fois de plus la pertinence des outils contextuels.
Vous pouvez la télécharger sur cette page qui donne aussi accès à des versions qui ne sont plus commercialisées de Mind Manager et d'autres extensions (dont Gyro Q).


Plus d'articles :

 

Nuage de mots-clés des articles