BingBot : Le crawler (user agent) du moteur de recherche change de nom

Microsoft annonce des modifications importantes concernant son robot de crawling. A partir du premier octobre 2010, ce dernier perdra d’une part l’étiquette bêta mais changera surtout de nom. Jusqu’à présent baptisé MSNBot (de MSN Search), et ce malgré le passage à Live Search, celui-ci s’appellera bientôt BingBot, en accord avec la marque actuelle du produit de la firme de Redmond.

Le user agent sera plus précisément identifiable par :

Mozilla/5.0 (compatible; bingbot/2.0 +http://www.bing.com/bingbot.htm)

Le champ From de l’en-tête HTTP renverra :

From: bingbot(at)microsoft.com

Du côté des instructions précisées à l’actuel crawler via le fichier robots.txt, Bing annonce une rétrocompatibilité. Avec toute fois un bémol puisque seront prises en compte par le BingBot les moins restrictives d’entre elles.

User-agent: bingbot
Disallow: /photos/

User-agent: msnbot
isallow: /photos/
Disallow: /videos/

User-agent: *
Disallow: /

Pour l’exemple ci-dessus, BingBot aura donc accès à tout le contenu excepté le répertoire photos.

Microsoft prévient à l’avance pour laisser le temps de mettre à jour les installations. Avis aux développeurs qui établissent des logs de crawl, aux adeptes du cloaking ou encore ceux qui souhaitent se faire passer pour le BingBot.

Source : Blog Bing

Google : La version chiffrée du moteur s’offre un sous-domaine

Google déployait le mois dernier sa version sécurisée via le protocole SSL. L’idée est clairement d’offrir aux internautes la possibilité d’effectuer leurs recherches en chiffrant leur trafic web.

Cette déclinaison du moteur de recherche s’offre maintenant un sous-domaine (https://encrypted.google.com/) afin de ne pas troubler l’authentification de nombreux services des Google Apps nécessitant l’URL actuelle, ie. https://www.google.com/.

A noter que ce changement donne la possibilité aux administrateurs de divers réseaux de filtrer ladite version sécurisée de Google pour une raison ou pour une autre.

Source : Search Engine Land

Référencement Google : Pages web allégées pour les Googlebots

La firme de Mountain View annonçait il y a quelques temps déjà la prise en compte du temps d’affichage d’une page web dans l’algorithme de positionnement de Google.

De façon compréhensible, certains se demandent si il est possible de dupliquer le site afin de proposer une version allégée des pages de ce dernier aux robots de Google qui passeraient par là ; juste le contenu, sans images ni JavaScript.

La réponse de Matt Cutts est évidemment sans appel : non car il s’agit clairement de cloaking. Il est en effet interdit d’afficher une page de façon différente selon qu’elle soit visitée par un internaute ou un bot.

Est de plus précisé que ne sont absolument pas utilisés les Googlebots pour calculer le temps de chargement d’un site.

Firefox 4 bêta : La fondation Mozilla souhaite l’avis de sa communauté

Des feedbacks ! C’est ce que demande la fondation Mozilla pour faire en sorte que la prochaine version majeure de son navigateur, Firefox 4, soit le plus en accord avec les attentes des membres de sa communauté.

Internautes, vous savez ce qu’il vous reste à faire pour soutenir Firefox.

Google Jazz : Arc-en-ciel dans les SERPS pour la Gay Pride 2010

A l’occasion de la Gay Pride 2010 s’étant tenue hier dans les rues de Paris, Google ajoute un liseré au bas du champ de recherche dans les pages de résultats. Un peu différemment de l’ornement proposé l’année passée.

A titre d’information, les couleurs contenues dans cet arc-en-ciel ont bel et bien des significations particulières : le rouge pour la vie et la guérison, le orange pour la santé et la fierté, le jaune pour le Soleil, le vert pour la sérénité, l’indigo pour l’harmonie et finalement le violet pour l’esprit.

Partenaires et blog à la une

Promotion