Ecrit par admin le Lundi 12 novembre 2007 à 14:55 - Catégorie Google
Depuis quelques temps déjà (juillet 2007), la mention « pages en résultats complémentaires » n’apparait plus dans les résultats de google suite à une volonté de Google, voir ce post en anglais sur googlewebmastercentral.
En tant que référenceur, on a besoin de connaitre quelles sont ces pages, afin de pouvoir les éliminer ou au contraire d’essayer de les rapatrier dans l’index principal.
Les commandes site:seoblackout.com **-wqk ne retournent plus de résultats, mais d’autres commandes fonctionnent encore :
- site:seoblackout.com/*
- site:seoblackout.com/&
La commande site:seoblackout.com/ donne toutes les pages d’un site (ici je n’utilise les www donc j’obtiendrai également les pages d’éventuels sous-domaines, pour obtenir les pages d’un domaine uniquement, il faut ajouter les www). La commande site:seoblackout.com/& donne les pages de l’index principal, pour voir quelles pages risquent d’être dans l’index complémentaire de Google, il suffit donc de saisir la commande suivante :
site:seoblackout.com/ -site:seoblackout.com/&
P.S : j’ai écrit ce billet suite à la lecture de cet article : L’index supplémentaire de Google
Catégorie: Google
Les proxies peuvent nuire au positionnement de votre site et envoyer vos pages dans les méandres des résultats de google. Je ne parle pas de l’internaute qui navigue avec un logiciel proxy ou qui modifie les paramêtres de son navigateur pour naviguer sur le web à l’aide d’un proxy. Je parle de celui qui passe par des proxys installés sur des sites web, exemple :

Ce sont donc ces proxies développés en php ou perl que les webmasters installent sur leur sites pour proposer à l’internaute de naviguer anonymement qui peuvent nuire à vos pages.
En quoi ces proxies sont-ils dangereux ?
Les pages visitées à l’aide de ces proxies sont mises en cache et indexées par les moteurs de recherche, les liens présents sur ces pages sont aussi suivis et mis en cache par ces scripts de proxy et surtout ces liens passent par le proxy, donc Googlebot suit ces liens.

Si vous venez de créer votre site, qu’il n’a pas ou peu de popularité, peu de liens entrants… alors vous êtes concerné par ce souci. Ces proxies pour certains existant depuis longtemps, ils ont bénéficiés d’une certaine popularité auprès de Google qui peut décider de leur attribuer la paternité de vos articles et donc de dégager vos pages de l’index pour duplicate content (contenu identique).
» Lire la suite : Attention proxy web, risque duplicate content
Catégorie: Google, Proxies, Sécurité Internet et SEO
Il arrive parfois en faisant une recherche sur Google de ne pas pouvoir accéder aux résultats de la recherche et de recevoir le message suivant de Google :
Désolés…
… nous ne pouvons pas traiter votre requête pour le moment. Un virus informatique ou un spyware (logiciel espion) nous envoie des requêtes automatiques, et il semble que votre ordinateur ou votre réseau soit infecté.

Par exemple, essayez une recherche sur forums topics ou powered by phpbb, vous obtiendrez à tous les coups ce message au bout d’une dizaine de pages de résultats, bien sûr on clique sur page 2, page 3…
Pour pallier à ça, il suffit d’interroger google labs project Google recherche accessible et là vous n’aurez plus ce message de Google.
Très utile pour les scrapers de contenu ou pour ceux qui font des requêtes sensibles sur google comme la recherche de mots de passe…
Définition de scraper : Récupérer le contenu d’une page web en vue de réutiliser ce contenu sur son propre site. Le but est d’obtenir du contenu sans efforts, la plupart du temps de façon automatique. Cela permet au scraper de générer des milliers de pages sur des thématiques ciblées. Sur ces pages ainsi générées, le scraper va ajouter des Adsenses ou des liens d’affiliation afin de gagner de l’argent facilement.
Catégorie: Google, Génération de contenu, Scraping
Ecrit par admin le Vendredi 17 août 2007 à 2:56 - Catégorie Google
Grâce à la commande tilde ~, il est possible de trouver des mots clés associés à un mot clé saisi dans le moteur de recherche de Google.
Exemple :
Si on tape le mot clé mp3 précédé d’un ~ ce qui donne :
~mp3
On observe, dans les résultats, certains mots en gras, dont mp3 bien sûr, mais aussi : music, CD,audio,songs…

Pour exclure le mot-clé lui-même on peut saisir la requête suivante :
~mp3 -mp3
Catégorie: Google