Quoi de neuf ?

Chercher une information à jour sur le web relève parfois du parcours du combattant. Périmés, datés, plus d’actualité les résultats de nos requêtes nous laissent parfois perplexes… Malgré la puissance présumée des algorithmes de recherche, Google et consorts privilégient de temps en temps des contenus super-optimisés (SEO) mais pas toujours pertinents. 

Le pire c’est lorsque l’on tombe pour une requête spécifique sur une page intemporelle sans moyen pour identifier sa date de publication. Le contenu semble intéressant mais est-il encore vrai au moment où on le lit?

actualité

Dans un tout autre domaine, on peut être amené à rechercher une information sur une entreprise, une personnalité et tomber sur une page intemporelle… Peut-on s’y fier?

Dans ces cas comme dans d’autres il y a plusieurs moyens de déterminer plus ou moins précisément cette date de publication :

Parfois c’est indiqué dans l’URL. En fonction du paramétrage du CMS qui propulse la page, l’adresse de la page contient parfois le mois et l’année de publication. C’est le cas pour mon blog par exemple où mes URLs sont sous la forme www.crack-net.com/année/mois/titre.html

On peut aussi effectuer une recherche en filtrant les résultats les plus récents (moins d’une semaines, moins d’un mois…). Il est même possible de préciser une période de recherche personnalisée pour des résultats plus précis. Mais pour dater une page spécifique intemporelle cette méthode reste assez empirique.



Pour ma part, j’utiliserais un outil que j’avais déjà décrit sur crack-net : WayBackMachine. Ce service d’archive d’internet crawl régulièrement le web en sauvegardant des copies des pages des sites qu’il visite et on peut ainsi afficher une page web telle qu’elle était à une date antérieure. Voici donc par exemple, à quoi ressemblait Google à ses débuts en 1998 lorsque le moteur de recherche était encore en Beta :

google en 1998 beta

Mon article sur WayBackMachine dont l’URL est : http://www.crack-net.com/2011/10/afficher-un-site-internet-qui-nexiste.html remonte à octobre 2011 comme vous pouvez le voir. On peut recouper la vérification en effectuant une recherche sur le service d’archive du web en tapant dans sa barre d’adresse : http://web.archive.org/web/*/www.crack-net.blogspot.com/2011/10/afficher-un-site-internet-qui-nexiste.html (soit : http://web.archive.org/web/*/www.site.com)

On constate qu’en effet cette page a été crawlée pour la première fois en 2011 et qu’elle apparait au mois d’octobre avec un peu de décalage par rapport à la date de rédaction exacte (1/10/2011) en raison de la fréquence de scan du web qui ne doit pas être quotidienne :

waybackmachine

Pour conclure, j’avoue ne pas m’attarder sur les pages intemporelles sauf si j’en connais l’auteur et qu’il est fiable. En effet, produire du contenu non daté, fourre tout est une technique bien connue des blogueurs.

Par exemple, pour pouvoir fournir du contenu à fréquence régulière, même en périodes de “syndrome de la page blanche”, on a tendance à rédiger des articles à l’avance, déconnectés de l’actualité et donc à très longue “date limite de consommation”. 

Sauf que certains poussent le vice jusqu’à ne faire que ça, en payant des rédacteurs d’articles intemporels, en privilégiant l’aspect quantitatif de leur publication. On les reconnait entre autre par le fait que les articles/pages ne sont jamais daté(e)s. Le but? Avoir un site mis à jour régulièrement bien qu’artificiellement ce qui avec une bonne optimisation des mots clés, un bourrinage de netlinking et un peu de spam sur les réseaux sociaux fini par payer tant et si bien qu’on les retrouve en pôle position dans les SERP (résultats de recherche). C’est du boulot, mais ça marche!

En matière de recherche sur le web donc, pour avoir du contenu pertinent fait prioritairement pour être lu par des humains et non optimisé pour apparaitre en haut des résultats de recherche je vous conseille d’aller au delà des 2-3 premières lignes et vous y verrez peut être apparaitre mon blog si vous lancez une requête high-tech/Geek… Et oui, tout ça pour ça ;-) Vous n’êtes pas obligé d’appliquer ce conseil… Sauf lorsque mon blog apparait au delà des 1ères lignes… HiHi!

Au passage, cet article est un exemple typique de contenu intemporel dont le contenu restera vrai tant que Waybackmachine existera et que les moteurs de recherche fonctionneront comme je l’ai évoqué… Mais cet article est daté et croyez le, rédigé du jour, vue que je n’ai pas un seul article d’avance ;-)

No Comment to " Connaitre la date de publication d’une page web pour vérifier qu’une actualité est vraiment d’actualité "