Distill.io, un service de monitoring de pages web puissant (qui agrège aussi les flux RSS)

Surveiller les changements sur des pages web n’est pas franchement un sujet neuf. Je me rappelle qu’en bon veilleur fauché j’utilisais vers 1996-1997 l’inoxydable C4U (inoxydable car toujours utilisable si vous disposez de la bonne version de Windows :-).

Les outils qui permettent cela sont très nombreux et vont du gratuit au pas trop cher (l’excellent Website Watcher bien sûr). Ce qui est étonnant c’est que toutes les générations se mélangent encore sur ce marché où des Watchthatpage.com, encore capable de faire du bon boulot sur des pages web peu complexes, côtoient des solutions plus récentes et plus en phase avec les besoins actuels des veilleurs. Distill.io (anciennement AlertBox) fait partie de cette nouvelle génération d’outils au potentiel intéressant et je vais maintenant en détailler l’usage.

Tout d’abord il faut comprendre que Distill.io est un outil qui joue sur deux tableaux puisqu’il fonctionne à la fois en local via un extension du navigateur (Firefox, Chrome) et dans le cloud. Le nombre de pages surveillées dans le navigateur est illimité en version gratuite mais le nombre de pages surveillées dans le cloud est limité à 5  puis évolue en fonction de la formule choisie.

Avant d’aller plus loin une petite précision à ce sujet. C’est bête à dire mais il faut bien comprendre que les solutions qui s’installent dans un navigateur (Update Scanner pour Firefox ou Page Monitor dans Chrome par exemple) ne surveillent vos pages que … lorsque votre navigateur est allumé. Pas grave lorsqu’on surveille des pages institutionnelles qui bougent très peu mais inimaginables lorsqu’il s’agit de suivre une actualité susceptible d’évoluer plusieurs fois par heure. Les extensions de ce genre ne font pas de « rattrapage » comme certains stagiaires que j’ai eu en formation le pensaient, une actu qui est passée sur une page à 21h puis a été « chassée » par d’autres vers minuit (pensez au taux de rafraîchissement de la page d’accueil des actus Yahoo par exemple) passera totalement inaperçue pour de tels systèmes de surveillance. Idem pour les logiciels installés sur des postes qu’on éteint pour raisons de sécurité avant de quitter le travail et qu’on rallume le lendemain à 8h. Même si vous utilisez la Rolls des « petits outils », à savoir Website Watcher, vous allez rater ce qui se sera passé durant les 12h d’extinction des feux, en tous cas sur les pages à forte activité. C’est aussi une des raisons pour lesquelles ces outils sont inefficaces pour surveiller les médias sociaux et qu’il faut évidemment leur préférer les outils de « social media monitoring », naturellement orientés « temps réel ». Cela étant dit passons à Distill.io.

Mettre une page sous surveillance

Vous pouvez démarrer en installant l’extension Firefox, Chrome ou Opera (voir ici) puis en vous créant ensuite un compte dans le service en ligne ou l’inverse.

Une fois cela fait rendez-vous sur une page que vous souhaitez surveiller, ici une page Yahoo Actualités afin d’avoir des mises à jour fréquentes pour ce test.Image 364

  1. Cliquez sur le bouton Distill installé dans la barre de votre navigateurImage 365
  2. Un menu s’ouvre qui vous propose de :
    1. Surveiller certaines parties de la page seulement
    2. Surveiller l’ensemble de la page
    3. Surveiller le flux RSS de la page, car oui, Distill.io est aussi un agrégateur de flux et peut vous alerter lorsqu’un flux est mis à jour.
  3. Cliquez sur la première possibilité (choisie pour cet exemple)
  4. Apparaît alors en bas de page une interface qui va vous aider à sélectionner les parties de la page à surveiller. Si vous maîtrisez les expressions régulières vous pouvez les utiliser pour cela. Sinon il suffit de passer votre souris sur les parties qui vous intéressent pour les voir s’entourer d’un liseré noire. Un clic les envoie alors dans les éléments surveillés. Image 366Ici je décide de surveiller les nouveaux articles à la Une et les articles les plus populaires. Il est possible d’ignorer un élément d’une partie déjà sélectionnée en cliquant dessus, elle est alors entourée d’un liseré rouge.Image 367
  5. Cliquez sur « Enregistrer les sélections ».Image 368
  6. La liste de toutes les pages surveillées (watchlist) apparaît alors dans un nouvel onglet.

Un nouveau menu vous propose alors plusieurs réglages relatifs à la page surveillée. Image 373

Vous allez pouvoir (si nécessaire) :

  • Sélectionner de nouvelles parties de la page surveillée en ouvrant le sélecteur
  • Choisir si la surveillance est effectuée sur Firefox (et donc dépendante de l’ouverture du navigateur) ou dans le cloud.
  • Renommer la surveillance
  • Choisir la fréquence de surveillance (de 10 secondes à jamais :-?)
  • Ajouter des actions de notification:
    • recevoir une notification en push sur le téléphone – Premium
    • afficher un pop-up lors d’un changement sur la page (navigateur)
    • faire retentir un signal sonore (navigateur)
    • recevoir un email
    • recevoir un SMS (quelle différence avec le push?) – Premium
    • appeler un webhook : çà dépasse un peu mes compétences mais d’après ce que j’ai lu çà permet de générer une action spécifique sur une page html externe, la mettre à jour automatiquement avec du nouveau contenu par exemple (je crois… si vous connaissez bien le sujet n’hésitez pas à donner des exemples dans les commentaires).
  • Ajouter des conditions : il s’agit d’une fonctionnalité puissante qui permet de n’être alerté que si certains éléments apparaissent dans les nouveautés de la page. Il peut s’agir d’un texte qui:
    • contient un mot-clé spécifique
    • ne contient pas un mot-clé spécifique
    • comporte un nombre supérieur à …
    • comporte un nombre inférieur à … (pratiques pour surveiller l’évolution d’un prix par exemple)
    • comporte un nombre qui a diminué de plus de…
    • comporte un nombre qui a augmenté de plus de …
    • correspond à un expression régulièreImage 375

Un système de filtrage potentiellement très puissant donc. D’autant qu’on peut cumuler les conditions.

Notons également que ces conditions peuvent s’appliquer à un flux RSS et qu’il est donc possible ainsi de le filtrer par mots-clés.

La consultation des changements se fait naturellement dans les emails de notification qui reprennent l’ensemble des modifications. On peut aussi les retrouver sur la page de Watchlist qui regroupe l’ensemble des pages surveillées et que nous allons maintenant détailler.

Image 371

Consulter les changements

Que vous soyez en mode local ou en mode cloud cette page est présentée de la même façon.

Image 369
Watchlist en version navigateur

Attention cependant, en mode gratuit il n’y a pas de synchronisation entre vos deux espaces de surveillance, ce qui veut dire que vous pouvez avoir 15 surveillances sur votre navigateur et 5 différentes dans le cloud sans pouvoir les gérer dans une même interface. Pas pratique mais c’est une bonne raison pour payer…

A partir de cette même interface il est possible de créer des dossiers/tags pour mieux exploiter ses surveillances et d’appliquer plusieurs traitements « en masse » aux pages :

Image 377

  • lancer la vérification manuellement
  • marquer comme lu
  • supprimer
  • tagger
  • synchroniser (Premium)
  • Power tools : à partir de là on peut :
    • exporter les pages surveillées en JSON ou CSV
    • importer de nouvelles pages « en masse » à condition des les avoir compilé en JSON (et là j’avoue ne pas comprendre comment les créateurs du service attendent qu’on s’en sorte si on est pas un peu développeur).
    • Feeds : là c’est aussi la frustration qui domine car je pensais pouvoir sortir un, voir plusieurs, flux RSS de Distill.io pour surveiller les changements directement dans un agrégateur mais lorsqu’on clique il ne se passe rien du tout. La fonctionnalité est-elle Premium? N’est-elle pas encore implémentée? Je n’ai rien trouvé à ce sujet dans l’aide en ligne et j’attends avec impatience le passage d’un des employés de cette société sur ce post pour en savoir plus.

Conclusion

Ce n’est pas le seul point négatif de l’outil. On regrettera par exemple l’impossibilité de surveiller les changements dans des fichiers bureautiques ou des fichiers images (graphiques par exemple) serait également un plus. Enfin on sent que l’outil est pour l’instant plus porté par des développeurs que par des marketeurs. Les possibilités techniques (REGEX, import JSON, Webhooks) sont probablement très intéressantes mais réservées essentiellement à d’autres développeurs… Ce n’est pas forcément un problème mais c’est un peu frustrant pour l’utilisateur Lambda.

Malgré cela il faut avouer que Distill.io est une très bonne surprise en ce qu’il permet de cibler précisément ce que l’on souhaite surveiller dans un page et cela simplement lorsqu’on reste sur les fonctionnalités autres que celles que je viens d’évoquer. Par ailleurs la diversité des types de notifications est intéressante, il n’y a pas tant de services de monitoring qui proposent des alertes par SMS par exemple, notons d’ailleurs que les apps pour Android et iOs sont annoncées comme étant en cours de développement, là encore une innovation dans ce secteur. On appréciera enfin la possibilité qu’il offre de surveiller des flux RSS et de leur appliquer les mêmes traitements qu’aux pages web. Bien évidemment Distill.io ne donnera sa pleine mesure que dans une de ses versions payantes mais celles-ci sont plutôt raisonnables , cette appréciation étant évidemment relative à la taille de votre budget (ou de votre non-budget…).

Distill.io, un service de monitoring de pages web puissant (qui agrège aussi les flux RSS)
Spread the love
  •  
  • 8
  •  
  •  
  •  
  •  
  •  
  •  
  •  

4 réflexions au sujet de “Distill.io, un service de monitoring de pages web puissant (qui agrège aussi les flux RSS)

  1. Chapeau bas Christophe.
    Encore un tour du magicien de l’outil pour tous.
    Excellent pour donner envie au novice.
    Je le mets de ce pas dans ma boîte à outil du veilleur,
    extension pour Firefox configuré à partager aux collaborateurs en herbes.
    Simplement merci.
    A+

Répondre à Gabi Trucmusch Annuler la réponse