OUTILS FROIDS
  • Société
    • OF Conseil
    • Christophe Deschamps
  • Prestations
    • Formation
    • Conseil
    • Conférences
  • Publications
    • Livres
      • Le nouveau management de l’information. La gestion des connaissances au coeur de l’entreprise 2.0.
      • La boîte à outils de l’intelligence économique
      • Organisez vos données personnelles. L’essentiel du PKM
    • Base de connaissances
    • Newsletter hebdomadaire d’Outils Froids
    • Les découvertes hebdomadaires d’Outils Froids
  • Contact
24 janvier 2022 par Christophe Deschamps

Mettre en place une veille « Quick & dirty » – I-5 : collecte de flux RSS

Mettre en place une veille « Quick & dirty » – I-5 : collecte de flux RSS
24 janvier 2022 par Christophe Deschamps

En ce presque début d’année (que je vous souhaite excellente), je reprends ma série sur la veille Quick & dirty avec un petit tour par Bing.
Comme vous le savez si vous lisez ce blog, Bing dispose d’un opérateur de recherche très intéressant pour les veilleurs puisqu’il permet de rechercher des flux rss thématique par mots-clés thématiques. Il s’agit de l’opérateur « feed: » que l’on va utiliser ainsi dans une requête :
feed:"machine learning"

Le résultat :

A l’instar de ce que nous avons fait dans le précédent article, nous allons utiliser un outil de scraping très simple pour récupérer ces résultats. Instant data scraping n’ayant pas donné satisfaction dans ce cas, j’ai utilisé un autre outil pratique et facile à mettre en œuvre, le service Data Miner dans sa version gratuite, qui ne nécessite que la création d’un compte et l’ajout d’une extension à son navigateur (Chrome).

Pour récupérer les flux RSS proposés comme résultats dans Bing il faut à partir de la page de résultats :

  1. Cliquez sur le bouton de l’extension dans son navigateur
  2. Pas besoin de créer une « recette » (recipe) car l’outil en propose qui ont été créées par d’autres utilisateurs. On utilisera ici la recette intitulée {Bing – Title, Summary and URL scrape}
  3. Sélectionnez « Next Page Automation » afin de pouvoir récupérer les résultats des pages 2,3,4, etc sans avoir à recliquer.
  4. Choisissez le nombre de pages de résultats à scraper
  5. Cliquez sur le bouton bleu « Scrape x pages ». Le crawling démarre et s’arrêtera tout seul à la fin de la 10ème page (dans cet exemple)
  6. Cliquez ensuite sur le bouton « Download » et choisissez l’option « Excel file »
  7. Ouvrez le fichier dans Excel et copiez la colonne C dans laquelle se trouvent les flux récupérés
  8. Collez-les dans le service OPML Generator, déjà utilisé à plusieurs reprises dans cette série d’articles
  9. Sauvegardez le fichier OPML sur votre disque dur
  10. Puis importez-le dans votre agrégateur de flux RSS
  11. Vous venez de récupérer 100 flux RSS traitant de machine learning
 
Photo de zhang kaiyv provenant de Pexels

 

 

 

Error happened.
Spread the love
        
Article précédentMettre en place une veille « Quick & dirty » – I-4 : collecte de flux RSSArticle suivant Technologies du faux : un état des lieux. Le rapport est disponible en version PDFCrédits : Brett Jordan

Laisser un commentaire Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

RETROUVEZ-MOI SUR

CHRISTOPHE DESCHAMPS

IMG_8825_3Consultant et formateur en veille stratégique, intelligence économique et mindmapping depuis 15 ans

Articles récents

Informer en 2025 (IVb) : les raisons de la défiance (France)14 février 2025
Informer en 2025 (partie IV) : les raisons de la défiance (USA)13 février 2025
Informer en 2025 (partie III) : Qui fact-checkera les fact-checkeurs ?12 février 2025

Catégories

  • Concepts
  • Infos
  • Méthodologie
  • Non classé
  • Outils
  • Premiers pas
  • Réflexions
  • Ressource
  • Revue de liens

Étiquettes

AlertesMotsCles analyser l'information chatGPT collaboratif Collaborer ConserverLeWeb ContentDiscovery Curation Dataviz Diffuser l'information Désinformation ExtensionNavigateur Facebook GestionVideos GoogleChrome HtmlToRss Informer Inoreader Intelligence artificielle intelligence économique IST knowledge management Lecture LLMs MediasSociaux mindmapping MonitoringMediasSociaux MoteurDeRecherche OSINT Outil collaboratif Outils Froids personal knowledge management PKM Presse RecherchePersonne RechercheWeb RevueDeLiens RSS SurveillancePagesWeb SurveillanceSourcesWeb Tutoriel Twitter Veille VeilleVideo Video

DERNIERS TWEETS

Tweets by crid

Recevez les nouveaux articles de ce blog

Informer en 2025 (IVb) : les raisons de la défiance (France)14 février 2025
Informer en 2025 (partie IV) : les raisons de la défiance (USA)13 février 2025
Informer en 2025 (partie III) : Qui fact-checkera les fact-checkeurs ?12 février 2025

Abonnez-vous à notre newsletter

mentions-legales

Articles récents

Informer en 2025 (IVb) : les raisons de la défiance (France)14 février 2025
Informer en 2025 (partie IV) : les raisons de la défiance (USA)13 février 2025
Informer en 2025 (partie III) : Qui fact-checkera les fact-checkeurs ?12 février 2025

Catégories

  • Concepts
  • Infos
  • Méthodologie
  • Non classé
  • Outils
  • Premiers pas
  • Réflexions
  • Ressource
  • Revue de liens