Jeu Référencement

Identifier les pages en résultats complémentaires

Ecrit par admin le Lundi 12 novembre 2007 à 14:55 - Catégorie Google

Depuis quelques temps déjà (juillet 2007), la mention « pages en résultats complémentaires » n’apparait plus dans les résultats de google suite à une volonté de Google, voir ce post en anglais sur googlewebmastercentral.

En tant que référenceur, on a besoin de connaitre quelles sont ces pages, afin de pouvoir les éliminer ou au contraire d’essayer de les rapatrier dans l’index principal.

Les commandes site:seoblackout.com **-wqk ne retournent plus de résultats, mais d’autres commandes fonctionnent encore :

- site:seoblackout.com/*
- site:seoblackout.com/&

La commande site:seoblackout.com/ donne toutes les pages d’un site (ici je n’utilise les www donc j’obtiendrai également les pages d’éventuels sous-domaines, pour obtenir les pages d’un domaine uniquement, il faut ajouter les www). La commande site:seoblackout.com/& donne les pages de l’index principal, pour voir quelles pages risquent d’être dans l’index complémentaire de Google, il suffit donc de saisir la commande suivante :

site:seoblackout.com/ -site:seoblackout.com/&

P.S : j’ai écrit ce billet suite à la lecture de cet article : L’index supplémentaire de Google

Commentaires (9)

Catégorie: Google

Attention proxy web, risque duplicate content

Ecrit par admin le Vendredi 9 novembre 2007 à 16:18 - Catégorie Google, Proxies, Sécurité Internet et SEO

Les proxies peuvent nuire au positionnement de votre site et envoyer vos pages dans les méandres des résultats de google. Je ne parle pas de l’internaute qui navigue avec un logiciel proxy ou qui modifie les paramêtres de son navigateur pour naviguer sur le web à l’aide d’un proxy. Je parle de celui qui passe par des proxys installés sur des sites web, exemple :

cache google page proxy

Ce sont donc ces proxies développés en php ou perl que les webmasters installent sur leur sites pour proposer à l’internaute de naviguer anonymement qui peuvent nuire à vos pages.

En quoi ces proxies sont-ils dangereux ?

Les pages visitées à l’aide de ces proxies sont mises en cache et indexées par les moteurs de recherche, les liens présents sur ces pages sont aussi suivis et mis en cache par ces scripts de proxy et surtout ces liens passent par le proxy, donc Googlebot suit ces liens.

google proxy result

Si vous venez de créer votre site, qu’il n’a pas ou peu de popularité, peu de liens entrants… alors vous êtes concerné par ce souci. Ces proxies pour certains existant depuis longtemps, ils ont bénéficiés d’une certaine popularité auprès de Google qui peut décider de leur attribuer la paternité de vos articles et donc de dégager vos pages de l’index pour duplicate content (contenu identique).

» Lire la suite : Attention proxy web, risque duplicate content

Commentaires (8)

Catégorie: Google, Proxies, Sécurité Internet et SEO

Scraper Google

Ecrit par admin le Jeudi 18 octobre 2007 à 17:38 - Catégorie Google, Génération de contenu, Scraping

Il arrive parfois en faisant une recherche sur Google de ne pas pouvoir accéder aux résultats de la recherche et de recevoir le message suivant de Google :

Désolés…
… nous ne pouvons pas traiter votre requête pour le moment. Un virus informatique ou un spyware (logiciel espion) nous envoie des requêtes automatiques, et il semble que votre ordinateur ou votre réseau soit infecté.

google erreur

Par exemple, essayez une recherche sur forums topics ou powered by phpbb, vous obtiendrez à tous les coups ce message au bout d’une dizaine de pages de résultats, bien sûr on clique sur page 2, page 3…

Pour pallier à ça, il suffit d’interroger google labs project Google recherche accessible et là vous n’aurez plus ce message de Google.

Très utile pour les scrapers de contenu ou pour ceux qui font des requêtes sensibles sur google comme la recherche de mots de passe…

Définition de scraper : Récupérer le contenu d’une page web en vue de réutiliser ce contenu sur son propre site. Le but est d’obtenir du contenu sans efforts, la plupart du temps de façon automatique. Cela permet au scraper de générer des milliers de pages sur des thématiques ciblées. Sur ces pages ainsi générées, le scraper va ajouter des Adsenses ou des liens d’affiliation afin de gagner de l’argent facilement.

Commentaires (6)

Catégorie: Google, Génération de contenu, Scraping

Trouver des mots-clés associés sur Google

Ecrit par admin le Vendredi 17 août 2007 à 2:56 - Catégorie Google

Grâce à la commande tilde ~, il est possible de trouver des mots clés associés à un mot clé saisi dans le moteur de recherche de Google.

Exemple :

Si on tape le mot clé mp3 précédé d’un ~ ce qui donne :
~mp3

On observe, dans les résultats, certains mots en gras, dont mp3 bien sûr, mais aussi : music, CD,audio,songs…

MP3 requete Google commande Tilde

Pour exclure le mot-clé lui-même on peut saisir la requête suivante :

~mp3 -mp3

 

 

Commentaires (2)

Catégorie: Google



SEO BLACKOUT

Site web dédié aux techniques de référencement et de positionnement de sites web sur les moteurs de recherche Google, Yahoo, MSN.
Certaines parties du site sont en accès restreint, ces espaces sont réservés à la SEO Black Hat Team.


Don't Be Evil !