Ecrit par admin le Lundi 8 février 2010 à 18:56 - Catégorie SEO BlackOut Life
La SEO BlackOut Team s’est réunie pour la seconde fois le week-end dernier, ce fût un excellent week-end, riche d’échanges et d’alcool.
Nous avons échangé sur les différentes techniques de monétisation. Chacun de nous a présenté aux autres de nouveaux outils black hat et techniques black hat, des outils de soumissions avancés, des outils de génération de contenu ainsi qu’un outil pour mieux optimiser ses campagnes publicitaires.
Voici ci-dessous, la Seo BlackOut Team au complet, vous pouvez toujours vous amuser à essayer de trouver qui se cache derrière chaque cagoule

La SEO BlackOut Team organisera peut-être un jour, un SEO Black Hat Camp, ce sera l’occasion d’échanger de façon plus large
Catégorie: SEO BlackOut Life
Ecrit par admin le Mercredi 27 janvier 2010 à 14:25 - Catégorie Google,Scripts PHP
Il y a quelques jours, nous vous présentions un outil nommé Google Suggest php script permettant d’extraire les suggestions proposées par Google à partir d’un mot-clé, les résultats ainsi obtenus étaient à nouveau extraits et ainsi de suite selon le niveau de profondeur défini par l’utilisateur du script (jusqu’à 5 niveaux).
Et bien, aujourd’hui nous vous proposons en plus les options suivantes :
- Gestion de listes de mots
- Intégration de mots mixés
- Test de mots + lettres de l’alphabet
- Récupération du nombre de résultats
Voici le script php google suggest nouvelle version :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
| <?php
//Script Google Suggest by http://www.seoblackout.com
// Auteurs du script : Beunwa http://divioseo.fr/ & Tiger http://www.seoblackout.com
// Contributeurs émérites : Seg http://www.wagablog.com/ & Meuhsli http://www.thugeek.com/
// Url article du script pour bugs, commentaires... : http://www.seoblackout.com/2010/01/27/google-suggest/
?>
<form action="" method="post">
<table><tr><td>
Keyword : <textarea name="kw" rows="10"><?=strip_tags($_POST['kw'])?></textarea>
</td><td>
et <textarea name="mix2" rows="10"><?=strip_tags($_POST['mix2'])?></textarea>
</td><td>
<br />
Langue :
<select name="lang">
<option value="fr">FR</option>
<option value="en">EN</option>
</select>
<br />
Profondeur :
<select name="depth">
<option value="1">1</option>
<option value="2">2</option>
<option value="3">3</option>
<option value="4">4</option>
<option value="5">5</option>
</select>
<br />
Alphabet :<input type="checkbox" name="alph" />
</td></tr></table>
<br />
<input type="submit" value="Go" />
</form>
<?php
if(isset($_POST['kw'])){
$lang = strip_tags($_POST["lang"]);
if($lang == '') $lang = "fr";
$depth = strip_tags($_POST["depth"]);
if($depth == '') $depth = "1";
$kwsd = array();
$kwsd=explode("\n",trim(strip_tags($_POST["kw"])));
foreach ($kwsd as $lst) {
if($lst != "\n"){
//mots cles simple
ggSuggest($lst, $lang, $depth);
//mots cles avec compléments
$kws2 = array();
$kws2=explode("\n",strip_tags($_POST["mix2"]));
foreach ($kws2 as $mix2) {
ggSuggest($lst.$mix2, $lang, $depth);
}
//alphabet
if(strip_tags($_POST["alph"]) == "on"){
$alpha = "a";
while($alpha != "z"){
ggSuggest($lst.' '.$alpha, $lang, $depth);
$alpha = ++$alpha;
}
}
}
}
}
function ggSuggest($kw, $lang, $depth = 1, $inc = 1){
global $tabKw;
$tabKw[] = $kw;
$url = 'http://www.google.com/complete/search?hl='.$lang.'&js=true&qu='. urlencode($kw);
if (function_exists('curl_init')) {
$header = array(
"Accept: text/xml,application/xml,application/xhtml+xml,
text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5",
"Accept-Language: fr-fr,fr;q=0.7,en-us;q=0.5,en;q=0.3",
"Accept-Charset: utf-8;q=0.7,*;q=0.7",
"Keep-Alive: 300");
$ch = curl_init();
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_VERBOSE, true);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5);
curl_setopt($ch, CURLOPT_TIMEOUT, 5);
curl_setopt($ch, CURLOPT_REFERER, 'http://www.google.com/');
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)' );
curl_setopt($ch, CURLOPT_HTTPHEADER, $header );
curl_setopt($ch, CURLOPT_URL, $url);
$result=curl_exec ($ch);
curl_close ($ch);
} else {
$result= file_get_contents($url);
}
preg_match_all('/\["(.*?)",/si', $result, $kwgoogle, PREG_SET_ORDER);//mot
preg_match_all('/\,"(.*?)résultats",/si', $result, $nbresult, PREG_SET_ORDER);//nb resultats
if ($kwgoogle=='' || $inc > $depth) {
return $tabKw;
}else {
$ii = 0;
foreach($kwgoogle as $v){
$tk = utf8_decode(strip_tags($v[1]));
if(!in_array($tk, $tabKw)){
$tk = str_replace ('\r',"", $tk);
$kwr = utf8_decode($nbresult[$ii][1]);
if($kwr == "") $kwr = 0;
echo $kwr.' ; '.$tk.'<br />';
$ii++;
flush();
ggSuggest($tk, $lang, $depth, $inc+1);
}
}
}
return $tabKw;
}
?> |
Un grand merci à Seg (Wagablog – Google Analytics) et Meuhsli (Blog Geek) de l’agence référencement Résoneo, qui nous proposent ici une contribution majeure.
Merci encore une fois à Beunwa (Référencement Dijon), pour avoir contribué au développement du script Google Suggest.
Merci à eux 3 pour avoir accepté de partager publiquement et gratuitement avec vous ces améliorations !
Le web est un lieu de partage, keep this spirit !
A lire à propos de Google Suggest chez copains :
Catégorie: Google,Scripts PHP
Ecrit par lemoussel le Lundi 25 janvier 2010 à 22:15 - Catégorie Scraping,Scripts PHP
Nous avons vu dans nos différents articles comment extraire/parser le contenu d’une page en utilisant les expressions régulières. La difficulté de cette approche est la maitrise de la rédaction des expressions régulières.
Dans cet article, je vous propose d’essayer une autre méthode par l’utilisation des fonctions DOMDocument et DOMXPath de PHP 5.
La question qui se pose alors : Comment déterminer la structure DOM d’un document HTML ? Cela ne va t’il pas être plus compliqué que les expressions régulières ?
La réponse est non ! En effet avec le plug-in Firebug pour FireFox, l’exploration de la structure DOM d’une page HTML est très simple. Pour ce faire, nous allons reprendre l’exemple d’extraction des backlinks référencés par Alexa avec le petit blog de geektitude Insolite du Geek.
Sous FireBug, il suffit de sélectionner la première URL (1), le chemin Xpath s’affiche alors (2). Il nous suffit “Copier le chemin XPath” (3).

Nous obtenons le chemin XPath (2) suivant : /html/body/div/div/div[3]/div/div/div/div/div/ol/li/div/p/a
Et voilà le plus dur est fait ! Il suffit juste d’intégrer la requête XPath dans le script PHP suivant :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
| <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>Scraping avec DOMDocument & DOMXpath</title>
</head>
<body>
<?php
// Alexa Sites Linking to Insolite-du-Geek
$url = 'http://www.alexa.com/site/linksin;0/www.insolite-du-geek.fr';
$queryXPath = '/html/body/div/div/div[3]/div/div/div/div/div/ol/li/div/p/a';
$dom = new DOMDocument();
@$dom->loadHTMLFile($url);
$x = new DOMXPath($dom);
$nodeList = $x->query($queryXPath );
foreach ($nodeList as $node)
echo utf8_decode(urldecode($node->nodeValue))."<br/>";
?>
</body>
</html> |
7 lignes de code PHP pour réaliser un scraping de page HTML.
Remarques :
- Noter la présence du @ devant la fonction loadHTMLFile(). Cela évite d’avoir les messages de Warning PHP de défaut de structure DOM du document HTML.
- J’ai remarqué que dans certains cas Firebug, insére pour la balise <table> la balise <tbody>. Cette balise n’étant pas présente dans le document, il faut la supprimer de la requête XPath sinon aucun résultat ne sera obtenu.
Sources :
W3C Recommendation : XPath 1.0 standard
Plus d’informations sur XPath : Xpath Tutorial
Catégorie: Scraping,Scripts PHP
Ecrit par admin le Mercredi 20 janvier 2010 à 12:20 - Catégorie Scripts PHP
Le script google suggest a été mis à jour, vous pouvez consulter la nouvelle version ici : Google suggest, mais avant, je vous suggère de consulter le texte ci-dessous.
Tout le monde ou presque connait Google Suggest, qui suggère automatiquement des termes de recherche au fur et à mesure que l’on saisit notre requête, à chaque fois que l’on tape une lettre supplémentaire, la liste est modifiée. Cet outil fournit également, à côté de chaque suggestion, une estimation du nombre de résultats sur google que renvoit chaque mot-clé de la liste.
Les mots-clés proposés correspondent « soit-disant » aux recherches que font fréquemment les internautes (d’où l’intérêt pour les référenceurs).

Le script Google suggest que nous vous proposons, permet à partir d’un mot-clé, de trouver toutes les suggestions faites par Google pour ce mot-clé et les mots-clés trouvés et ainsi de suite selon la profondeur d’analyse choisie.
Par exemple, si je saisis référencement, le script va extraire toutes les propositions de mots-clés en partant de référencement et pour chaque mot-clé trouvé, le script va à nouveau extraire les mots-clés correspondants et ainsi de suite.
Ce script va ensuite éliminer les doublons pour vous proposer une liste unique de mots-clés.
Script php Google suggest :
Copiez le code ci-dessous dans un fichier que vous nommez google-suggest.php par exemple et uploadez-le sur votre FTP, il vous suffit ensuite d’appeler ce fichier pour trouver un max de mots-clés pour votre long tail
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
| <?php
//Script Google Suggest by http://www.seoblackout.com
// Auteurs du script : Beunwa http://divioseo.fr/ & Tiger http://www.seoblackout.com
// Url article du script pour bugs, commentaires... : http://www.seoblackout.com/2010/01/20/referencement-google-suggest/
//le script affiche les resultats au fur et a mesure mais les renvois aussi dans un tableau au besoin
?>
<form action="" method="post">
Keyword : <input name="kw" type="text" value="<?php echo strip_tags($_POST['kw']); ?>" />
<br />
Langue :
<select name="lang">
<option value="fr">FR</option>
<option value="en">EN</option>
</select>
<br />
Profondeur :
<select name="depth">
<option value="1">1</option>
<option value="2">2</option>
<option value="3">3</option>
<option value="4">4</option>
<option value="5">5</option>
</select>
<br />
<input type="submit" value="Go" />
</form>
<?php
if(isset($_POST['kw'])){
$kw = strip_tags(utf8_encode($_POST["kw"]));
$lang = strip_tags($_POST["lang"]);
if($lang == '') $lang = "fr";
$depth = strip_tags($_POST["depth"]);
if($depth == '') $depth = "1";
ggSuggest($kw, $lang, $depth);
}
function ggSuggest($kw, $lang, $depth = 1, $inc = 1){
global $tabKw;
$tabKw[] = $kw;
$url = 'http://www.google.com/complete/search?hl='.$lang.'&js=true&qu='. urlencode($kw);
if (function_exists('curl_init')) {
$header = array(
"Accept: text/xml,application/xml,application/xhtml+xml,
text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5",
"Accept-Language: fr-fr,fr;q=0.7,en-us;q=0.5,en;q=0.3",
"Accept-Charset: utf-8;q=0.7,*;q=0.7",
"Keep-Alive: 300");
$ch = curl_init();
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_VERBOSE, true);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5);
curl_setopt($ch, CURLOPT_TIMEOUT, 5);
curl_setopt($ch, CURLOPT_REFERER, 'http://www.google.com/');
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)' );
curl_setopt($ch, CURLOPT_HTTPHEADER, $header );
curl_setopt($ch, CURLOPT_URL, $url);
$result=curl_exec ($ch);
curl_close ($ch);
} else {
$result= file_get_contents($url);
}
preg_match_all('/\["(.*?)",/si', $result, $kwgoogle, PREG_SET_ORDER);
if ($kwgoogle=='' || $inc > $depth) {
return $tabKw;
}else {
foreach($kwgoogle as $v){
$tk = utf8_decode(strip_tags($v[1]));
if(!in_array($tk, $tabKw)){
echo $tk.'<br />';
flush();
ggSuggest($tk, $lang, $depth, $inc+1);
}
}
}
return $tabKw;
}
?> |
Démo du script Google Suggest :
Pas de démo en ligne, par contre voici le résultat obtenu pour la recherche référencement :
- référencement
- referencement
- referencement gratuit
- referencement gratuit automatique
- referencement gratuit google
- referencement gratuit sans lien retour
- referencement gratuit site web
- referencement gratuit sur google
- referencement gratuit moteurs de recherche
- referencement gratuit blog
- referencement gratuit sans lien de retour
- referencement gratuit annuaire
- referencement gratuit yahoo
- referencement google
- referencement google gratuit
- referencement google gratuite
- referencement google site
- referencement google sitemap
- referencement google sites
- referencement google site internet
- referencement google site joomla
- referencement google maps
- referencement google prix
- referencement google joomla
- referencement google payant
- referencement google flash
- referencement-google.fr
- referencement google tarif
- referencement google tarifs
- referencement newsgroup
- referencement newsgroups
- referencement newsgroup francais
- referencement newsgroup binaire
- referencement newsgroup binaires
- referencement newsgroup fr
- referencement newsgroup free
- referencement newsgroup gratuit
- referencement newsgroupe
- referencement newsgroup us
- référencement naturel
- référencement naturel définition
- referencement naturel google
- referencement naturel google gratuit
- référencement naturel seo
- référencement naturel comment ça marche
- référencement naturel et payant
- référencement naturel payant
- référencement naturel blog
- référencement naturel internet
- référencement naturel joomla
- referencement naturel sur google
- referencement yahoo
- referencement yahoo gratuit
- referencement yahoo.fr
- referencement site internet
- referencement site internet gratuit
- referencement site internet google
- referencement site internet bordeaux
- referencement.com
- referencement.com group
- referencement.com boursorama
- referencement site web
- referencement site web gratuit
- referencement site web google
- referencement site web tunisie
- referencement site web pdf
- referencement site
- referencement site google
- referencement site google gratuit
- referencement site flash
- referencement site joomla
- referencement site iweb
- referencement site free
- référencement définition
- référencement définition marketing
- referencement blog
- referencement blog gratuit
- referencement blog google
- referencement blog wordpress
- référencement blogs
- referencement blogspot
- referencement web
- referencement web gratuit
- referencement webmaster
- referencement webradio
- referencement web maroc
- référencement webdev
- referencement webrankinfo
- referencement web 2.0
- referencement web tuto
- referencement web wikipedia
- référencement payant
- référencement payant définition
- referencement payant google
- référencement payant prix
Un grand merci à Beunwa du site Création de site Dijon qui a largement amélioré le script de départ
Catégorie: Scripts PHP
Ecrit par Robin le Mardi 29 décembre 2009 à 21:54 - Catégorie Outils référencement,Scripts PHP
Créez votre annuaire optimisé pour le référencement en 20 secondes, c’est maintenant possible.
Nous avons tous un vieux domaine qui traîne avec un contenu pas tellement clean qui n’est pas forcément au top sur les moteurs de recherches. Alors pourquoi ne pas installer un annuaire ?
Freeglobes, Arfoo, MyDir … Non mieux Bartemis ! Vous n’en avez jamais entendu parler ? C’est normal cet annuaire est sorti il y a seulement quelques jours tout droit des mains d’un spécialiste du référencement.
Vous l’aurez donc compris ce script d’annuaire est nativement optimisé pour le référencement et n’oublie aucun détail des metas au duplicate content en passant par l’url rewriting.
L’aspect référencement n’est pas le seul atout de ce script :
- il se veut aussi très léger et simple à utiliser,
- il présente aussi une page d’installation automatique vous permettant de l’installer en 20 secondes chrono si vous avez vos identifiants mysql sous la main.
- Cet installeur vous ajoute directement du contenu unique vous permettant de ne pas partir de zéro.
- Le développement et les modifications sont toutes aussi simple que l’installation, car que ce soit pour une intégration ou pour l’ajout d’un module vous ne passerez pas deux heures à chercher où mettre votre code car il est classé par page dans un seul fichier.
Si cette petite présentation vous a donné envie de créer votre annuaire avec Bartemis alors ne tardez plus et rendez vous sur Bartemis.com. Pour ceux étant encore dubitatif sur le script, je vous invite à consulter une des nombreuses démos que j’ai installé.
Je suis ouvert à tous vos conseils ou demandes de modifications et attends vos feedbacks en masse que ce soit dans les commentaires de ce billet ou sur le forum. Je conseille aussi aux éditeur d’annuaire, d’ajouter leur annuaire dans l’annuaire des annuaires
Billet écrit par Robin, développeur du script Bartemis.
Catégorie: Outils référencement,Scripts PHP
Ecrit par Inglourious Seo le Mardi 22 décembre 2009 à 14:24 - Catégorie Backlinks,Scraping
Bonjour à tous !
Je me présente, Aldo du nouveau black hat seo blog Inglourious-seo.com, je m’incruste ici pour vous présenter un superbe outil et me faire un peu de promo, donc si vous avez aimé cet article, inscrivez-vous vite à mon flux rss et suivez-moi sur twitter si vous êtes intéressé par l’utilisation de soft de spam.
Je pense que comme moi vous avez été nombreux à vous retrouver en galère d’un bon url harvester / scraper depuis que l’excellent scrape genious n’est plus maintenu à jour.
Je vous propose de découvrir un outil récent qui fait bien plus encore (manque que l’extraction des pr), mais les fonctions complémentaires sont bien plus intéressantes…
Pourquoi scraper des urls ?

Il faut savoir que l’on a tous tendance à systématiquement laisser des empreintes lorsque l’on fait des sites et plus encore quand c’est opensource.
Dès lors, on peut retrouver sur le net, le même script de guestbook sur des milliers de sites web.
Trouvez son empreinte (footprint ou dork pour le hacking) et vous obtiendrez la liste de tous les sites utilisants le script de guestbook vulnérable au dofollow.
Un exemple dépassé : « leave a reply » « powered by wordress » pour trouver des formulaires de commentaires WordPress sur Google.
Comme vous le voyez dans la capture d’écran, quelques footprints par défaut, sont disponibles avec le scrapebox.
Recherche et vérification des proxies automatiques

Si vous scrapez plus de 1000 urls chez Google, votre ip sera bannie à coup sûre, il faut donc la renouveler pour obtenir des milliers d’urls.
Scrape box se charge de vous les fournir à la demande et de les vérifier en temps réel.
Organisez vos listes, triez-les et vérifiez leur pagerank

Ces fonctions non indispensables sont néanmoins extrêmement utiles, vous pouvez :
- dédoublonner les urls
- dédoublonner les domaines
- Vérifier leur pagerank
- exporter/importer les listes
Référencement : Un outil à backlinks en plus ?
Spam de referer

Je n’oserai vous expliquer ce qu’est le spam de referer, vous trouverez plus d’informations à ce sujet ici , ça et là
Spam auto de commentaires

Vous avez la possibilité de “randomiser” pseudo, adresse mail, site et les commentaires via content spinning.
Assurez-vous de l’indexation de vos splogs créés via LFE en quelques minutes grâce au ping

Trackback Spammer

Bien qu’existante depuis plus d’un an, cette tactique est encore peu utilisée, envoyez un trackback aux bons endroits vous permet de gratter encore des liens dofollow (si vous savez où les trouver).
Plus de screenshots ?

Rendez-vous sur le site de l’éditeur : http://www.scrapebox.com/screenshots et la page de vente est là : http://www.scrapebox.com/
Catégorie: Backlinks,Scraping
Ecrit par lemoussel le Dimanche 22 novembre 2009 à 11:30 - Catégorie Outils référencement
Après avoir vu comment simplifier la soumission manuelle dans les annuaires nous allons, dans cet article, détailler une méthode permettant d’automatiser la soumission de formulaire.
Pour ce faire, il vous faut le plugin nommé « iMacros » qui est un utilitaire permettant d’automatiser des tâches sur votre navigateur WEB en enregistrant les différentes manipulations sous forme de scripts. Entre autre il permet de compléter des formulaires, de téléverser des textes, d’importer ou d’exporter des données à partir/vers des fichiers CSV et XML, de chercher/extraire des données (web scraping).
Bref tout ce que vous faites avec votre navigateur WEB, iMacros peut l’automatiser !
» Lire la suite : Utilisation de iMacros pour la soumission automatique de formulaire
Catégorie: Outils référencement
Ecrit par Bertimus le Mercredi 4 novembre 2009 à 12:56 - Catégorie Outils référencement
Que celui qui prend son pied à soumettre manuellement ses sites dans les annuaires me jette la première pierre, euh non plus judicieux, linke cet article depuis son plus gros site
Et oui, la soumission manuelle dans les annuaires est une tâche fastidieuse mais bonne nouvelle pour vous, l’enjeu de cet article est de vous livrer un outil (préconfiguré) pour rendre cette mission moins ennuyeuse.
» Lire la suite : Moins de prise de tête lors de la soumission manuelle dans les annuaires
Catégorie: Outils référencement
Ecrit par lemoussel le Lundi 2 novembre 2009 à 15:00 - Catégorie Captchas
Une des solutions connues pour outrepasser / bypasser les codes captchas antispam est l’utilisation d’un traitement OCR (Optical Character Recognition = Reconnaissance optique de caractères).
Pour effectuer ce type de traitement, l’image sur laquelle sera effectuée le traitement doit être soit en niveaux de gris ou en monochrome. Cette étape de transformation de l’image est une étape essentielle de tous traitements OCR car la complexité du programme et le temps de calcul s’en trouvent largement réduits.
Pour des raisons de portabilité la plupart des outils d’OCR utilise le format PNM (portable anymap) comme format d’image. L’avantage de ce type de format est de coder l’image dans sa plus simple expression. Le terme « PNM » étant une généralisation regroupant les formats réels PBM (portable bitmap file format – image binaire), PGM (portable graymap file format – image en niveaux de gris) et PPM (portable pixmap file format – image en couleur).
Les fichiers au format PNM se structurent de la même manière et n’introduisent aucune méthode de compression d’image. Les données dans ces fichiers expriment soit la valeur RVB pour le PPM, soit le niveau de gris dans le cas du PGM ou simplement avec des 1 ou 0 pour le PBM.
Par exemple pour le format PBM, qui nous intéresse, la structure est la suivante :
» Lire la suite : Captcha : Conversion d’image en PHP
Catégorie: Captchas
Ecrit par admin le Jeudi 1 octobre 2009 à 15:17 - Catégorie Cloacking,Google
Vous savez certainement que l’on peut interdire l’affichage du cache d’une page dans Google, cela est bien utile parfois.
Pour interdire l’affichage du cache, Google et les autres moteurs tels que Yahoo ou Bing par exemple, propose l’ajout d’une balise meta qui a pour syntaxe :
<META NAME="ROBOTS" CONTENT="NOARCHIVE">
ou
<META NAME="GOOGLEBOT" CONTENT="NOARCHIVE"> (pour interdire la mise en cache par googlebot uniquement).
Il y a quelques jours le serveur qui héberge mon site n’était plus accessible, j’ai donc eu dans mon navigateur un beau message « DNS error… vous pouvez afficher la page en cache », je clique sur le lien machinalement et là je vois le cache de mon site or dans mon head j’ai bien la meta noarchive qui est présente puisque j’interdis volontairement la mise en cache.
Voici 2 copies d’écrans, la première avec le cache seoblackout.com sur Google :

La seconde montre bien que la balise meta robots noarchive est bien présente dans le cache :

Michaël m’a donné le lien suivant sur twitter http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=156412 avec l’extrait suivant « due to temporary failure of the page’s web server… The cached page appears to users exactly… », suite à cette lecture, j’ai donc pensé que l’on voyait le cache car le serveur avait était out pendant quelques heures mais il n’en est rien puisque d’autres sites qui n’ont pas été out sont aussi touchés par ce souci.
De là, j’ai fais une demande de suppression de cache dans google webmaster tools, demande qui a aboutie en moins de 48 heures mais avec l’inconvénient de ne plus afficher le snippet dans les résultats. J’ai donc retiré la demande de suppression mais Google s’est remis à afficher le cache, sans remettre le snippet, j’ai à nouveau refais un demande de suppression de cache que Google a respecté un à deux jours au lieu des 90 jours annoncés dans webmasters tools, puisque depuis mon cache est à nouveau visible (suffit de saisir cache:www.seoblackout.com dans Google), c’est à n’y rien comprendre.
Je vous mets les copies d’écrans de mon Google Webmaster Tools ci-dessous :
Annulation de la première demande de suppression de cache :

Seconde demande de suppression de cache :

Conclusion : Google ne respecte pas, pour certains sites, la balise meta robots noarchive, et même lorsque l’on fait une demande de suppression du cache dans Google webmaster Tools, la demande est respectée provisoirement puisque le cache réapparait ensuite.
Dans mon cas, on ne voit que le cache de la home mais pour d’autres sites c’est toutes les pages internes qui apparaissent en cache malgré l’interdiction.
Je n’ai pour le moment aucune piste viable quant au pourquoi Google ne respecte pas cette meta pour certains sites. Bug ??
Catégorie: Cloacking,Google