[Résolu] indexation site du texte libre par google

HTML5, CSS3, Javascript, support des mobiles... Que penser de votre site ? Vous manquez d'informations pour la construction d'un site qui puisse s'afficher correctement partout ? C'est un problème simple, un peu complexe ? Venez ici !
caméléon
Animal mythique
Messages : 9528
Inscription : 08 nov. 2004, 17:54

[Résolu] indexation site du texte libre par google

Message par caméléon »

Salut,

J'essaye de comprendre pourquoi la recherche suivante http://www.google.fr/search?q=texte+libre+cognac n'affiche absolument aucune description pour le site de la librairie du texte libre, mis à part l'adresse web du site, ce qui est pénalisant pour que les visiteurs identifient le site.

Image

Vous auriez une idée ou suggestion au vu du code source?
Dernière modification par caméléon le 16 févr. 2012, 13:44, modifié 1 fois.
Teraoctet
Iguane
Messages : 769
Inscription : 08 sept. 2011, 00:44

Re: indexation site du texte libre par google

Message par Teraoctet »

Salut Caméléon,
A première vue ce site n'est peut être pas indexé dans son ensemble, ceci expliquerait peut être cela: du changement dans google http://www.google.fr/intl/fr/policies/
A moins qu'il n'aient pas toutes les informations voulues, OU que les propriétaires du site ont adoptés une autre politique de communication.
Préférez Kompozer 0.8b3(20100301)
caméléon
Animal mythique
Messages : 9528
Inscription : 08 nov. 2004, 17:54

Re: indexation site du texte libre par google

Message par caméléon »

Il se trouve que je suis assez proche du "propriétaire", et que ce n'est absolument pas volontaire de sa part, bien au contraire...
Par ailleurs, le site est référencé ainsi depuis dès mois (depuis sa création en fait) , ce n'est donc pas du à une modification récente de l’algorithme de Google.

D'autres pistes? Je pencherais plutôt pour une maladresse dans le code source, mais je me demande bien ou :-(
calimo
Animal mythique
Messages : 14118
Inscription : 26 déc. 2003, 11:51

Re: indexation site du texte libre par google

Message par calimo »

caméléon a écrit :Il se trouve que je suis assez proche du "propriétaire"
Ce qui est assez logique puisque tu postes en développement web :)
Allez Teraoctet, encore un petit effort :wink: Et pas non plus besoin de flooder quand tu n'as rien à dire :P

Quand je vois ça :
robots.txt a écrit :User-agent: * Disallow: /
je me dis que google est assez tolérant sur la syntaxe du robots.txt : il respecte même un fichier invalide ! :wink:
caméléon
Animal mythique
Messages : 9528
Inscription : 08 nov. 2004, 17:54

Re: indexation site du texte libre par google

Message par caméléon »

tu veux dire que c'est ce fichier qui bloque l'indexation par les moteurs de recherche???

Si ça se confirme, tu es un génie Calimo, je n'y aurais jamais pensé!!!
calimo
Animal mythique
Messages : 14118
Inscription : 26 déc. 2003, 11:51

Re: indexation site du texte libre par google

Message par calimo »

Eh oui, Google est un robot !

Pour être plus précis, un fichier robots.txt comme ceci

Code : Tout sélectionner

User-agent: * 
Disallow: /
(note le retour à la ligne dans la syntaxe correcte) demande aux robots de ne pas télécharger les pages du site de manière automatisée, quel que soit leur UserAgent.
Il se trouve que pour être indexé par google, un robot doit télécharger les pages. Évidemment c'est automatisé : il n'y a pas de petit lutin chez google qui définit manuellement quelle page télécharger :P Donc en effet, ce fichier empêche l'indexation.
Et pas que par Google : tu observeras la même chose sur ixquick, il n'est pas indexé sur Yahoo... idem sur tous les moteurs de recherche respectant le robots.txt (c'est à dire tous) :wink:

Le plus simple est de supprimer ce fichier, ou de remplacer par un Allow /. À moins que le site n'ait un gros problème de conception (ou qu'il soit très très limite niveau charge et bande passante) ça ne posera pas de problème :wink:

PS : ça n'a rien de génial, c'est un problème très courant chez les débutants que de croire que les robots sont mauvais et qu'il faut les désactiver, mais c'est inutile, les "mauvais" robots ne respecteront pas le fichier tandis que les bons respectent de toutes façons les trois lois :mrgreen:
Avatar de l’utilisateur
~HP
Varan
Messages : 1141
Inscription : 29 juin 2008, 13:22

Message par ~HP »

calimo a écrit :je me dis que google est assez tolérant sur la syntaxe du robots.txt : il respecte même un fichier invalide ! :wink:
Le fichier n'est pas invalide… il est seulement servi avec de mauvaises entêtes :

Code : Tout sélectionner

# curl -IL "http://letextelibre.fr/robots.txt"
HTTP/1.1 200 OK
Server: nginx/0.7.65
Date: Wed, 15 Feb 2012 15:46:38 GMT
Content-Type: text/html; charset=utf-8
Connection: keep-alive
Vary: Accept-Encoding

Code : Tout sélectionner

# curl "http://letextelibre.fr/robots.txt"
User-agent: *
Disallow: /
Comme ton navigateur affiche le texte en utilisant un rendu HTML, les sauts de ligne ne sont pas rendus… CQFD.
caméléon
Animal mythique
Messages : 9528
Inscription : 08 nov. 2004, 17:54

Re: indexation site du texte libre par google

Message par caméléon »

mais alors, il est bon ou pas ce fichier robot.txt? Dans le doute, il vaut mieux le supprimer non?
calimo
Animal mythique
Messages : 14118
Inscription : 26 déc. 2003, 11:51

Re: …

Message par calimo »

~HP a écrit :Le fichier n'est pas invalide… il est seulement servi avec de mauvaises entêtes :
Ah oui bien vu !
caméléon a écrit :mais alors, il est bon ou pas ce fichier robot.txt? Dans le doute, il vaut mieux le supprimer non?
Non il est pas bon puisqu'il a pour effet d'empêcher l'indexation du site :wink:
Répondre

Qui est en ligne ?

Utilisateurs parcourant ce forum : Aucun utilisateur inscrit et 2 invités