Outwit, un plugin Firefox pour collecter et structurer les données du web

OutilsKnowledgeWorker – OutilsVeille

Outwit Hub est un plugin Firefox proposé par la société Outwit qui devrait ravir les super-crunchers. Il s’agit en effet d’un outil qui permet de récupérer des données sur une ou plusieurs pages web et de les structurer, par exemple sous forme de tableau. Par rapport à des outils de capture comme Zotero ou Scrapbook, conçus avant tout pour capturer des pagesentières, son avantage est dans la possibilité de collecter des données à un niveau de granularité plus fin.
Il est ainsi capable de récupérer :

  • des images (avec possibilité de lancer un diaporama)
  • des liens
  • des adresses emails,
  • du texte non-structuré (qui sera ensuite structuré)
  • les données présentes dans des tableaux
  • des listes
  • des adresses de fils RSS,

Olivier Ezraty, qui l’a testé en long, en large et en travers (voir ici ou ), nous propose à ce sujte des tutoriels plutôt convaincants. La facilité avec il collecte les données des entreprises du fichier Forbes 2000 et les transfère sous Excel est bluffante.
Outwit Hub agit donc comme un chaînon manquant entre le non-structuré et le structuré et peut s’avérer
particulièrement utile pour tous ceux dont la tâche consiste (entre autres choses) à collecter les données non-structurées issues de sources éparses afin d’en tirer de la matière informationnelle, je pense en premier lieu aux veilleurs.
Voir également les tutos de ce blog.

Spread the love
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.