Google permet facilement, via ses Webmaster Tools, de supprimer une url de son index. Pour cela, rendez-vous sur la gestion de votre nom de domaine, cliquez sur Outils puis URL à supprimer.
Attention cependant, car il faut au préalable porter attention au fait que le contenu que vous souhaitez supprimer renvoie bien l’un des codes d’erreur HTTP suivant :
- 404 : Le document n’existe pas
- 410 : Le document n’existe plus
Je préfère personnellement la seconde, tout bonnement parce qu’elle correspond vraiment à notre cas. Rajoutons donc le code suivant dans notre page :
<?php
header("HTTP/1.0 410 Gone");
?>
Cette ligne aura pour effet de modifier l’entête de la page et donc de renvoyer le code HTTP 410. Veillez à le mettre le plus haut possible dans la page pour éviter la classique erreur suivante :
Warning: Cannot modify header information – headers already sent by …
Si vous ne respectez pas cela et que votre page est toujours accessible (ie. HTTP 200), la suppression sera refusée par Google et vous pourrez voir la raison suivante :
Le contenu que vous avez envoyé pour la suppression du cache s’affiche sur une page tierce.
Comme vous le savez peut-être, les informations incluses dans nos résultats de recherche sont diffusées sur des pages Web de sites tiers accessibles au public. Même si nous supprimions cette page de notre index, le contenu en question resterait présent sur le Web.
Pour supprimer ces informations de nos résultats de recherche et du Web, vous devez contactez le webmaster de ce site. Une fois la modification effectuée par l’administrateur, envoyez une demande de suppression de la copie en cache ou attendez que les résultats de recherche prennent en compte la modification lors de la prochaine exploration de la page.
En lisant le texte de la page des GWMT, vous remarquerez peut-être qu’il est possible d’arriver à nos fins en interdisant l’accès aux robots via le célèbre fichier robots.txt. C’est ce que j’ai fait mais, impatient, je passe par les outils pour webmasters pour que cela aille plus vite. Je pars bien dans cette optique du fait que Google représente plus de 90% des recherches effectuées en France et qu’il est donc important que cela soit rapidement réglé avec lui. Les autres suivrons avec le fameux robots.txt mis en place.
Précisez ensuite l’adresse de la page que vous voulez voir disparaître du net via le bouton + Nouvelle demande de suppression des GWMT. La suite de la procédure est très intuitive et vous mène au résultat suivant :
Une fois la page supprimée, vous pouvez très bien la réintégrer à l’index via le bouton prévu à cet effet :