Next INpact

Pour explorer le web, l'Internet Archive songe à ignorer les fichiers Robots.txt

lundi 24 avril 2017 à 14:38

Pour l'Internet Archive, les fichiers Robots.txt sont devenus un frein à la bonne indexation du web. Une partie des sites deviendraient inaccessibles dans sa base de données suite à un changement de leurs directives pour les moteurs de recherche. Pour continuer son travail, elle explore l'idée de ne plus en tenir compte.

Lire la suite