ChangeDetection, un service de surveillance de pages web vieux, moche (et puissant et gratuit)

ChangeDetection est un service en ligne qui est présent dans le paysage depuis … 1999 et vous pourriez vous demander quelles raisons m’amènent à évoquer ce fossile du web par ailleurs dénué de la moindre trace de visuels accueillants ou de graphismes accrocheurs. C’est que sous cette austerité se cache un outil particulièrement puissant au regard de son côut… inexistant. Une petite perle pour les veilleurs désargentés qui mérite donc d’être détaillée ici.

Découverte de l’outil

La création du compte se fait « à l’ancienne », comprenez sans vos identifiants Google ou Facebook, mais très rapidement car le service ne demande qu’une adresse email pour démarrer. Une fois l’inscription terminée vous accédez directement à une interface de travail tout ce qu’il y a de plus classique pour ce genre de services :

Dans la partie « Welcome » un bref récapitulatif des pages que vous surveillez et qui ont changé récemment. Juste en dessous vous trouvez la fenêtre qui permettra de créer une surveillance de page web. La partie « Recent changes on internet » présente quant à elle les modifications repérées par l’outil sur des pages d’autres utilisateurs ayant décidé de laisser ces surveillances publiques (cf. infra).

Pour la petite histoire je voulais utiliser comme exemple la page d’actualité du site web d’un candidat à la présidence mais après vérification ils disposent tous d’un flux RSS ou permettent facilement d’en créer un lorsqu’on connait la structure WordPress (Fillon) ou Drupal (Arthaud). Plutôt une bonne nouvelle donc. Mais cela ne veut pas dire qu’il ne reste rien à surveiller sur les sites des candidats. En effet, il ne faut jamais oublier que le flux RSS d’un site est une sélection des modifications qui ont eu lieu sur celui-ci, par exemple celles de la page d’actualité ou de la page « communiqués de presse ». Or, il existe de nombreuses autres pages qu’il peut être pertinent de mettre sous surveillance. S’il s’agit du site d’une entreprise on pourra par exemple vouloir surveiller les offres d’emploi, les pages des différentes branches,etc. Pour les sites des candidats il pourra s’agir par exemple de surveiller la page Web-TV de Jean Lassalle, dont les changements ne remontent pas dans le flux RSS, ou encore la page « La campagne » de Jacques Cheminade.

Choisissons le premier exemple pour mettre en pratique ce service.

Mise en place d’une surveillance de page

  1. copiez le lien de la page à surveiller, ici : http://jeanlassalle2017.fr/la-web-tv/
  2. collez le lien dans la fenêtre évoquée ci-dessus
  3. cliquez sur « Next », un nouveau formulaire apparaît
  4. vous pouvez modifier le titre de la page à surveiller qui a été récupéré automatiquement
  5. choissez la périodicité de l’envoi de l’email qui doit vous alerter des modifications de la page surveillée. Il s’agit d’un outil gratuit et comme souvent dans ce cas la fréquence maximale est quotidienne. Remarquez toutefois la possibilité de récupérer l’alerte sous forme de flux RSS plutôt que d’email. Nous y reviendrons.
  6. vous pouvez ensuite choisir de ne recevoir une alerte que si un changement notable (sizable) a été detecté par l’outil. Ce n’est pas très précis bien sûr mais il s’agit par exemple en cochant cette case d’éviter d’être alerté d’un changement de date automatique sur une page.
  7. vous pouvez ensuite choisir de n’être alerté que si certains mots-clés apparaissent ou disparaissent de la page surveillée. Par exemple je pourrai ne vouloir être alerté que si dans les nouvelles vidéos proposées sur la page, le mot Syrie (au hasard :-)) apparait. Notez qu’il s’agit ici d’une fonctionnalité généralement réservée aux versions payantes de ce genre de services.
  8. la dernière case à cocher vous permet de soumettre la page surveillée à l’annuaire public de ChangeDetection, ce qui d’après moi n’a aucun intérêt. Si vous cochez cette case il vous faudra aussi choisir s’il s’agit d’un contenu potentiellement choquant ou non.

Une fois ces étapes suivies vous accédez à la page d’accueil de l’alerte, sorte de mini tableau de bord divisé en trois partie :

  • La première partie est un récapitulatif des critères de l’alerte que vous avez défini. Au fur et à mesure de son fonctionnement d’autres éléments apparaîtront comme les dates des dernières modifications detectées sur la page ou l’heure du dernier monitoring. C’est aussi ici que vous pourrez éditer l’alerte ou la stopper si nécessaire. (Notez qu’à partir de cette étape je prends un exemple de pages que je surveille depuis plus longtemps que celle de Jean Lasalle pour pouvoir vous montrer des résultats).
  • La seconde partie, « Summary of most recent changes » vous donne une vision synthétique des récentes modifications de la page dont vous avez par ailleurs été alerté par email ou flux RSS. Les liens bleus vous permettent de filtrer les résultats :
    • show added and deleted (par défaut) : affiche les éléments nouveaux ou supprimés
    • only added : ne montre que les nouveautés
    • only deleted : ne montre que ce qui a été supprimé de la page
    • show context (par défaut) : permet de voir quelques mots avant et après ce qui a été supprimé ou ajouté
    • hide context : l’inverse donc
    • show sizable (par défaut) : affiche les changements notables
    • show all : affiche tous les changements
    • Chaque résultat est suivi (en vert) du nombre de mots qui ont été ajoutés/supprimés et du pourcentage de modifications que cela a entraîné dans la page.
  • 3ème partie Link to this change log : il s’agit d’un lien vers une version publique mais cachée de cette même page que vous pouvez par exemple transmettre à un destinataire de votre veille pour qu’il l’intègre à ses favoris et aille la consulter régulièrement (oui, oui, il est permis de rêver).

Autre fonctionnalité très intéressante de l’outil, lorsque vous cliquez sur « View changes » vous accéder à une copie cache de la page stockée sur les serveurs de ChangeDetection.

Les changements y sont surlignés et de nouveau vous retrouvez les filtres déjà détaillés :

Vous pouvez également choisir de ne voir que les extraits des textes modifiés ou le full text de la page sans sa mise en page HTML.

De nouveau il s’agit habituellement de possibilités reservée aux services payants ou aux versions premium.

Récupérer un flux RSS des modifications des pages surveillées.

Bien sûr il existe des services très performants comme Fivefilters pour créer des flux RSS sur des pages qui n’en ont pas (voir ce précédent article par exemple). Si l’on n’est pas très à l’aise avec ce genre d’outil on peut utiliser ChangeDetection dans un un objectif similaire même s’il offre bien sûr moins de granularité. Pour cela :

  1. il faut avoir choisi « RSS only » dans l’étape 2 de configuration de l’alerte (cf. point n°5 ci-dessus). Si ce n’est pas le cas éditez votre alerte pour procéder à la modification.
  2. se rendre dans « Rss Feed » dans le menu en haut à droite
  3. dans « RSS feed options » cliquez sur « Enable this feed » (rendre ce flux disponible)
  4. vous pouvez également choisir ici ce qui apparaîtra ou non dans le flux en utilisant les cases à cocher
  5. cliquez sur « Update »
  6. récupérez (copier) le flux présenté dans la partie intitulée « RSS feed link »
  7. Ajoutez-le (coller) à votre agrégateur favori

Cà y est, vous venez de mettre sous surveillance via un flux RSS une page qui n’en avait pas. Là encore il s’agit d’une fonctionnalité qu’on retrouve essentiellement sur les outils de monitoring payants comme Diphur ou Onwebchange. Une différence tout de même : là où ces services génèrent un flux unique par alerte, ChangeDetection propose un flux global qui reprend l’ensemble de modifications des pages mises sous surveillance. C’est un peu moins pratique mais il n’est pas difficile avec Inoreader de créer des filtres (ou des règles) qui redistribueront chaque alerte du flux dans un dossier spécifique de l’agrégateur. Voici comment se présente le flux dans cet agrégateur :

Conclusion

ChangeDetection n’est pas un outil parfait bien sûr, il aura probablement un peu de mal avec certaines pages en HTML5 très « graphiques », tout comme il en avait d’ailleurs avec le format flash (mais quel outil de ce genre, même payant, n’en avait pas). Et puis c’est sûr il est vraiment moche mais franchement au regard des fonctionnalités évoquées ci-dessus osons le dire, il n’a pas de concurrents dans la catégorie des purs gratuits.

ChangeDetection, un service de surveillance de pages web vieux, moche (et puissant et gratuit)
5 (100%) 4 votes
Spread the love
  •  
  • 16
  •  
  •  
  •  
  •  
  •  
  •  
  •  

4 réflexions au sujet de “ChangeDetection, un service de surveillance de pages web vieux, moche (et puissant et gratuit)

  1. Hello Christophe,

    merci pour ce joli focus.
    Yes, l’efficacité ça compte.

    J’aime beaucoup ce billet qui vient nous aider lorsqu’on ne s’en sort pas sur certaine page n’ayant pas de flux RSS avec un outil dédié, parfois complexe effectivement.
    J’ai quelques pages que je gère avec Website Watcher pour cette raison, mais je n’ai pas de flux en sortie.
    Cette solution semble me convenir pour parfaire la surveillance en un seul endroit: notre cher Inoreader.

    Donc merci Christophe,
    je vais essayé.

    A+

    Nota: si tu as un peu d’intelligence d’outil sur l’équivalent des macros de Website Watcher je serais intéressé dans un futur billet. C’est un mode d’une grande efficacité pour remplacer les actions manuelles quotidiennes de recherche dans des grandes de bases de données qui n’ont pas la requête dans l’URL, et dont il peut y avoir des centaines de nouveautés par jour.

  2. Bonjour,
    j’utilise changedetection depuis des années. Mais en préparant une session de formation sur la veille informative, je me rends compte que c’est visualping.io qui apparaît lorsque l’on veut se rendre sur changedetection.com
    Il semblerait que seuls les anciens utilisateurs de changedetection puissent encore l’utiliser.

    • Bonjour,
      Oui effectivement, j’ai eu la même surprise il y a quelques jours. Ce service était là depuis tellement longtemps que je ne le vérifiais plus avant une formation. Erreur 🙂 C’est bien dommage en tout cas, même s’il y aévidemment d’autres solutions.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.