Mars 10 18

Version imprimable Iceberg n°41: du 19/02/2010 au 19/03/2010 (63 services, articles et outils)


Voici l' des 30 derniers jours. Bonnes découvertes!


Mars 10 17

Version imprimable Whatdoyousuggest, pour naviguer à vue dans les suggestions Google


- -

Voici un service qui ne révolutionnera pas la recherche sur internet mais dont j'aime bien l'idée. Il s'agit en fait de proposer les suggestions Google pour un mot-clé de manière visuelle et par étapes.
Lorsqu'il n'y a plus de suggestions Whatdoyousuggest  propose les 4 premiers résultats de la requête ainsi élaborée. Rien ne vous empêche évidemment d'en reprendre les termes pour lancer une requête classique dans Google.


Ce qui est intéressant c'est la manière dont les choix de mots-clés sont proposés, cela modifie beaucoup la perception que l'on en a par rapport à une liste. Comme d'habitude cartographier l'information est payant et c'est en implémentant des petites fonctionnalités de ce type que l'on améliorera l'expérience utilisateur. Mais est-ce bien l'objectif des moteurs de recherche?


Mars 10 16

Version imprimable Ellerdale Trends, la rencontre entre temps réel et sites de référence




Vous trouverez dans La lettre Recherche et Référencement qui vient de paraître un article de 5 pages concernant l'excellent moteur hybride Trends, de la société Ellerdale.
Egalement au sommaire de ce numéro :



Fév. 10 18

Version imprimable Comparatif de trois moteurs pour rechercher en plein texte dans la presse papier




Il semblerait que depuis septembre 2009 les solutions permettant de rechercher en plein-texte et gratuitement dans la presse papier se multiplient. Attention, seule la recherche est gratuite, l'accès au document reste évidemment payant mais cela peut modifier nos pratiques de veille habituelles. En effet, plutôt que de s'abonner à quelques magazines et journaux dans le but de les "piger" quotidiennement et à la main, il suffit d'entrer les mots-clés qui vous intéressent et d'acheter que ceux qui nous semblent utiles. Cela peut aussi permettre d'accéder directement aux pages intéressantes sur les journaux auxquels on est déjà abonnés et donc de pas perdre de temps à les éplucher.
Attention toutefois. Ce gain de temps pourrait être compensée négativement par une perte de richesse globale. En effet, lorsqu'on feuillette un magazine c'est tout un contexte que l'on intègre et qui peut parfois aider à comprendre une information unique. Par ailleurs il y a un indéniable effet "sérendipité" à faire ce travail. Cela permet notamment de découvrir des mots-clés, expressions, thèmes auxquelles on aurait pas pensé initialement.
On retombe une fois de plus sur la traditionnelle distinction veille radar/ veille ciblée.
Plus d'informations moins ciblées laissent place à la sérendipité, à la découverte de signaux faibles. Moins d'informations plus ciblées permettent de se concentrer sur l'essentiel. Une méthode n'est pas meilleure qu'une l'autre, il s'agit simplement de savoir les moduler en fonction des besoins.

Mais revenons à nos moutons. Avec l'arrivée hier de nous en avons donc maintenant trois moteurs de recherche de ce type à notre disposition dont voici les principales caractéristiques :

  Alerts Presse Relay Madeinpresse Pikanews
Sources Toute la presse que l'on trouve chez Relais H. Donc pas seulement française. Presse proposée par le site de vente de presse sur Internet Viapresse. (France, étranger) Presse européenne papier + Internet + TV Radio (à ajouter ici)
50000 sources annoncées par Presse Index
Recherche -Possibilité de rechercher dans les sommaires
-Possibilité de cibler sa recherche par thématiques
-Tri par pertinence et date
-Prise en compte de la troncature
Interface de recherche avancée :
-filtre "presse en kiosque"
-filtrage par dates
-filtrage par thématiques
-nuage de tags pour recherches associées
Nombreuses possibilités de tris croisés :
-périodes
-pays
-types de support (presse, Internet, TV)

-Regroupement par périodes

-Tendances avec possibilités d'affiner en cliquant dans les graphiques
Visualisation des articles -Miniature de la double page
-Gros plan (fixe) sur le mot-clé dans la page
-Le plus clair
- Miniature de la double page
- Phrase dans laquelle on trouve le mot-clé
- Miniature de la double page
- Phrase dans laquelle on trouve le mot-clé
Alertes Par email Alertes visibles sur son compte. A priori pas d'alertes par email (à confirmer). -Par email
-Flux RSS annoncés depuis le début mais toujours pas actifs
Achat d'articles Achat du magazine entier Achat du magazine entier A priori non sinon en recommençant la recherche sur www.KiosquePro.com


La solution la plus avancée pour l'instant est Pikanews de Press Index. On regrettera toutefois de ne pouvoir acheter directement un magazine suite à une recherche. L'intégration de ce moteur est du Kiosque Pro semble aller de soi mais Pikanews est encore en bêta et sans doute est-ce la raison de ce manque.

Plus globalement on regrettera l'impossibilité de ne pouvoir acheter que les articles qui nous intéressent. Ce serait là un vrai plus mais j'imagine que les problèmes juridiques à régler sont nombreux.

Si vous êtes éditeurs d'un de ces moteurs n'hésitez pas à venir compléter cet article



Fév. 10 17

Version imprimable Factery Labs associe recherche temps réel et médias traditionnels


 OutilsRechercheWebDivers

J'ai publié ce mois-ci dans La lettre Recherche et Référencement (payante) un article sur Factery Labs, un moteur qui associe la détection des tendances de l'actualité via les réseaux sociaux et la recherche d'éléments factuels tirés de sources reconnues. Une tentative intéressante donc. 
Au sommaire du numéro de février vous trouverez également les articles suivants : 



Fév. 10 16

Version imprimable Tableau Software Public, pour passer au niveau supérieur de la visualisation de données


 OutilsCartographieD_Information

Il est des outils dont on entend beaucoup parler mais dont les coûts sont rédhibitoires. C'est le cas de Tableau Software, un logiciel d'analyse de données et de génération de schémas et de cartographies dynamiques qui semble beaucoup plaire aux pros de la business intelligence et de la visualisation outre-atlantique. Malheureusement il atteint tout de même la bagatelle de 1000 $ en version desktop perso et le double en version pro (possibilité de le connecter à de très nombreuses bases de données et solutions BI).
Heureusement voilà qu'arrive Tableau Software Public. Il s'agit d'une version gratuite de l'outil dont les résultats ne seront publiables qu'en ligne et de manière publique. Il vient alors concurrencer les excellents Swivel et Manyeyes d'IBM.
L'un des avantages de Tableau Software Public est que vous disposez d'un logiciel client qui vous offre une souplesse d'utilisation bien plus importante puisque vous appliquez d'abord tous les traitements nécessaires aux données en local avant de les publier.
Il ne s'agit bien sûr pas d'un tableur mais Tableau propose toutefois des fonctionnalités qui permettent de traiter les données de manière très fine comme vous pourrez le voir sur cette vidéo de présentation. Par ailleurs les graphiques générés sont interactifs, ce qui en fait en plus un outil pédagogique intéressant.
Vous trouverez sur cette page des exemples de ce qu'il est possible d'en tirer. Impressionant non?
On peut dire que Tableau Software est aux fonctions de visualisation d'Excel ce que Word est au bloc-note Windows.
N'hésitez pas à faire partager vos cartes aux lecteurs d'Outils Froids.


Fév. 10 01

Version imprimable Microsoft Academic Search, une intéressante alternative à Google Scholar


-

En rédigeant le mois dernier un article sur Entitycube (excellent moteur de recherche basée sur la détection d'entités nommées proposé en bêta par Microsoft), pour La Lettre Recherche & Référencement d'Abondance, je suis tombé sur Microsoft Academic Search, un moteur développé par la même équipe chinoise.
Egalement en bêta, ce moteur indexe tout de même 5 millions d'articles. Il peut évidemment être interrogé en plein texte mais permet aussi une recherche par auteur, conférence, revue et date. On peut alors croiser l'ensemble de ces critères. L'innovation principale de ce moteur repose sur la détection d'entités nommées qui lui permet de détecter automatiquement ces mêmes éléments.
A noter qu'il existe un langage d'interrogation structuré que nous n'avons pas testé en détail et qui semble permettre d'effectuer des requêtes avancées. Il est décrit dans cette page (un peu après le milieu)
La page de résultats par défaut présente le nombre de citations d'un article et propose un lien supplémentaire lorsqu'il est téléchargeable gratuitement. 



On voit qu'elle propose par ailleurs 3 autres onglets qui valent la peine d'être explorés :

Author : donne évidemment la liste des auteurs cités mais fait bien plus lorsqu'on clique sur l'un d'eux.



Comme vous pouvez le voir le moteur présente une fiche personnalisée dans laquelle on trouve :
  • différents indicateurs sur les citations de cet auteur
  • un graphique présentant la courbe des publications de l'auteur dans le temps ainsi que la courbe des citations.
  • l'université/laboratoire où il travaille
  • tous ses articles (ceux indexés par le moteur évidemment)
  • toutes les citations indexées
  • les co-auteurs de ses articles
Il est possible de classer les articles d'un auteur par date de publication, citations et rank, un indice spécifique à ce moteur. 
Un explorateur visuel permet normalement d'explorer le réseau de co-auteurs d'un auteur mais il ne fonctionne pas actuellement.

Conference : permet de retrouver des présentations données lors de conférences

Journal : permet d'accéder aux revues scientifiques dans lesquels sont parus les articles correspondants à vos mots-clés.

Il est dommage que l'application de cartographie automatique ne fonctionne pas mais on voit que, par sa capacité à enrichir intelligemment les résultats et à créer des liens entre éléments, la détection d'entités nommées a beaucoup à apporter à la recherche d'informations. Un outil à suivre donc ... et à utiliser.


Jan. 10 11

Version imprimable Comment mettre en place une veille d'actualité audio et vidéo?


-

Depuis quelques années la veille sur l'actualité de la presse écrite est largement facilitée par les flux RSS proposés par des portails comme Google Actus ou Yahoo! News. Il reste toutefois un énorme champ à investir qui est celui des actualités diffusées sous forme audio et vidéo. Comment être informé qu'un reportage sur votre concurrent a été diffusé sur une radio? Comment savoir si on a parlé de votre produit au journal télévisé?
Je ne parle pas ici de surveiller des mots-clés dans les titres ou résumés des actualités, ce qui est relativement aisé avec un bon moteur de recherche de vidéos. Non, je parle ide surveiller ce qui se dit durant les journaux télévisés ou radiodiffusés, du contenu plein-texte donc. Pour cela nous allons avoir besoin de moteurs de recherche qui font ce travail d'indexation de fichiers audios, c'est à dire qui disposent de logiciels leur permettant de retranscrire textuellement du contenu audio, ce qu'on appelle du "speech to text".

Je ne vais pas vous mentir, les solutions sont peu nombreuses : soit on achète une prestation en ce sens, soit on arrive à le faire "artisanalement" et c'est bien sûr ce que nous allons voir maintenant. Pour info l'excellent Podzinger/Everyzing faisait cela très bien mais il s'est transformé en plateforme d'entreprise payante.

Nous avons identifié trois moteurs de recherche audio/video disposant de la technologie "text to speech" et nous allons maintenant voir comment les mettre sous surveillance.

Blinkx vous simplifie la tâche

Le plus simple d'usage est sans conteste Blinkx. Ce moteur indexe le contenu de milliers de vidéos et génère des flus Rss par mots-clés. Deux choses à prendre en compte toutefois avant de se lancer :

  1. Par défaut Blinkx lance la recherche dans l'ensemble de ses catégories. Vous risquez donc d'avoir des résultats provenant des catégories TV shows, fitness ou travel. Pour éviter cela il est nécessaire d'utiliser l'opérateur "channel". Exemple : avec le terme "intelligence"
    1. channel:news intelligence 
  2. Ne pas oublier de classer les résultats par date (par défaut ils sont classés par pertinence).
Blinkx est très pratique mais ses sources sont essentiellement anglophones.



Le flux RSS de Blinkx dans Google Reader

Voxalead, le plus puissant


Les labs d'Exalead nous gratifient d'un magnifique outil, Voxalead, qui non seulement dispose de sources françaises (France 24, LCI et M6) mais peut aussi transcrire de l'anglais et, beaucoup plus rare, du chinois ou de l'arabe. Voxalead à par ailleurs le bon goût de donner le texte entier de la transcription, ce qui peut permettre de la traduire via Google. 
Seul problème, il ne génère pas de flux Rss. C'est donc là qu'un peu de bricolage va être nécessaire pour en créer un. J'ai décidé d'utiliser pour cela Dapper, un service d'aide au scrapping à la fois simple à utiliser et puissant. Je ne vais pas expliquer comment faire, d'abord parce que, comme je viens de le dire, c'est simple et d'autre part parce qu'il y a des vidéos qui le font très bien par ici. Sachez par contre qu'au moment de cliquer sur les éléments à mettre sous surveillance le mieux est de sélectionner la première vidéo comme ceci.



Dapper détecte tous les autres objets similaires dans la page, c'est à dire les fichiers vidéos et uniquement cela, pas de pollution donc dans votre flux Rss.

J'ai par ailleurs effectué les mêmes tests sur la langue chinoise en utilisant les techniques de veille multilingue décrites fin 2008 dans ce billet Pratiquer la veille multilingue en 4 étapes et 15 outils linguistiques. Pour cela il faut bien sûr utiliser les fonctionnalités de traduction automatique de Google Reader. Les résultats sont corrects et permettent de mettre en place un premier niveau d'alerte. Je n'ai pas fait le test pour la langue arabe mais il n'y a pas de raison que ce soit plus mauvais (y en a t-il?).

PBS pour compléter

PBS est une chaîne d'information publique américaine qui propose l'ensemble de son contenu indexé. Le moteur de PBS est assez basique mais fonctionne bien. Sa mise sous surveillance via Dapper n'a pas posé de problèmes. 
Il existe une autre chaîne publique américaine qui propose la même fonctionnalité en plus avancée sur son site, il s'agit de C-Span et de son portail C-Span Video Library. Nous n'avons toutefois pas pu mettre la requête sous surveillance (pour l'instant). 

Comme vous le voyez l'offre est pour l'instant assez limitée, tout du moins pour la langue française. Voxalead propose tout de même France 24, LCI et M6. Il serait toutefois étonnant de ne pas voir arriver de nouveaux acteurs dans les mois à venir. Google avait d'ailleurs déjà montré ses velléités avec l'excellent portail Gaudi (Google Audio Indexing), pour l'instant réservé aux déclarations des hommes politiques américains, mais pour combien de temps?


Plus d'articles :

 

Nuage de mots-clés des articles