Je vous propose un petit jeu, ce n’est pas un concours de référencement
, d’ailleurs je ne sais pas dans quelle catégorie le classer, car je crois que n’importe qui peut y participer.
FIN DU JEU ! merci à tous et toutes pour votre participation
Les gagnants de la première session sont :
iNemo et devilox, bravo à eux
La requête était twitter et retournait 1 440 000 000 de résultats.
Les gagnants de la seconde session sont :
ImagiKa, Victor, Clem et GDTSB.
Félicitations à eux 
La requête était www => 17 520 000 000 de résultats.
Principe et règles du concours :
Le but est de trouver une requête* sur google.fr** qui retourne le nombre de résultats le plus proche de
17 520 000 000 résultats.
Par exemple seo retourne 192 000 000 résultats (9 mars 2010 à 2 h 15) :
http://64.233.163.44/search?hl=fr&gl=fr&q=seo
Celui ou celle qui donnera la requête renvoyant le nombre de résultats le plus proche de
17 520 000 000 résultats gagne le concours.
* La requête peut être composée de n’importe quels caractères.
** Voici l’url officielle sur laquelle je déterminerai les résultats :
http://64.233.163.44/search?hl=fr&gl=fr&q=requ%EAte
Envoyez-moi votre requête en postant un commentaire au pied de cet article :
Donnez-moi la requête exacte dans votre commentaire (requête du type : http://64.233.163.44/search?hl=fr&gl=fr&q=requ%EAte) ainsi qu’une adresse mail valide (dans le champs prévu à cet effet).
Si 2 personnes ont le même nombre de résultats alors ce sera celui qui aura trouvé la requête la plus courte qui gagne. Dans le cas où 2 participants ont trouvé la même requête alors c’est celui qui aura envoyé sa réponse le premier qui gagne le concours.
La fin du concours est prévue le mardi 9 mars 2010 à 15 heures.
Lots :
Il est prévu d’offrir un t-shirt Seo BlackOut au premier.
Vous pouvez voir un aperçu des t-shirts sur cette photo (il n’y a rien au dos du t-shirt, sauf pour la team
).
C’est un petit lot plus symbolique qu’autre chose et un petit jeu du même acabit.
Livraison des t-shirts en France métropolitaine uniquement.
P.S : J’ai eu cette idée suite à ce tweet de Audiofeeline, je me suis demandé quelle était la requête
.
Catégorie: Concours de référencement, SEO BlackOut Life
Ecrit par admin le Lundi 8 mars 2010 à 18:03 - Catégorie Concours de référencement
Je participe au concours pokerice pour voir
Pas de contenu pokerice pour le moment mais ça devrait arriver prochainement ou pas…
Catégorie: Concours de référencement
Ecrit par admin le Vendredi 26 février 2010 à 11:07 - Catégorie Actualités référencement
Le jeudi 11 mars à 18 heures, DigiPort [fr] vous propose d’assister à une conférence sur le SEO Black Hat et l’E-commerce.
La conférence aura lieu à EuraTechnologies (165 avenue de Bretagne à Lille).
Deux de mes amis y interviennent, Aurélien Bardon et Mathieu Gheerbrant, pour présenter ce qu’est le Seo Black Hat, tout deux connaissent bien le secteur du commerce en ligne et les techniques de référencement dites Black Hat.
La conférence est gratuite, ce sera l’occasion d’échanger avec d’autres e-commerçants ou référenceurs, alors si vous êtes dans le coin à ce moment-là, n’hésitez pas à y assister
Informations supplémentaires et inscriptions ici :
http://www.digiport.org/agenda/detail/evenement/-1f3a680160.html
Catégorie: Actualités référencement
Ecrit par admin le Jeudi 25 février 2010 à 15:11 - Catégorie Référencement
Il peut être parfois nécessaire de détecter un site adulte, cela peut être utile dans le cas où vous maintenez un annuaire par exemple ou encore dans le cas où vous utilisez LFE (link farm evolution) et que vous ne souhaitez pas poser vos liens sur des blogs à dominante adulte.
Comment détecter un site adulte ?
Il existe plusieurs solutions :
- Chercher dans le texte de la page des mots-clés adultes à l’aide d’un script et d’une liste de mots-clés adultes prédéfinis
- Analyser les pixels des images présentes sur la page et si dominante chair alors suspicion (idée proposée par Sébastien Billard)
- Analyser les pubs présentes sur la page, avec au préalable un listing des régies adultes comme Carpediem…
- Utiliser des api qui classent les sites dans des catégories comme http://bcws.brightcloud.com
Je vous propose une autre solution, simple à mettre en place qui consiste à utiliser la fonction SafeSearch de Google :
La fonction SafeSearch de Google empêche l’affichage dans les résultats de recherche des pages Web à caractère sexuel.
Il suffit donc de mettre l’option safesearch sur strict et ensuite de saisir la commande info:ndd_adulte.tld, si 0 résultats retournés, alors c’est un site adulte.
Il ne vous reste plus qu’à faire le script qui va bien…
N.B : Cet idée d’article m’est venu suite à une discussion lancée par Maxime sur la sphère : http://www.seosphere.com/forum/index.php?showtopic=10060
Il ya certaiment d’autres méthodes, les commentaires sont là pour ça
Catégorie: Référencement
Ecrit par admin le Lundi 8 février 2010 à 18:56 - Catégorie SEO BlackOut Life
La SEO BlackOut Team s’est réunie pour la seconde fois le week-end dernier, ce fût un excellent week-end, riche d’échanges et d’alcool.
Nous avons échangé sur les différentes techniques de monétisation. Chacun de nous a présenté aux autres de nouveaux outils black hat et techniques black hat, des outils de soumissions avancés, des outils de génération de contenu ainsi qu’un outil pour mieux optimiser ses campagnes publicitaires.
Voici ci-dessous, la Seo BlackOut Team au complet, vous pouvez toujours vous amuser à essayer de trouver qui se cache derrière chaque cagoule

La SEO BlackOut Team organisera peut-être un jour, un SEO Black Hat Camp, ce sera l’occasion d’échanger de façon plus large
Catégorie: SEO BlackOut Life
Ecrit par admin le Mercredi 27 janvier 2010 à 14:25 - Catégorie Google, Scripts PHP
Il y a quelques jours, nous vous présentions un outil nommé Google Suggest php script permettant d’extraire les suggestions proposées par Google à partir d’un mot-clé, les résultats ainsi obtenus étaient à nouveau extraits et ainsi de suite selon le niveau de profondeur défini par l’utilisateur du script (jusqu’à 5 niveaux).
Et bien, aujourd’hui nous vous proposons en plus les options suivantes :
- Gestion de listes de mots
- Intégration de mots mixés
- Test de mots + lettres de l’alphabet
- Récupération du nombre de résultats
Voici le script php google suggest nouvelle version :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
| <?php
//Script Google Suggest by http://www.seoblackout.com
// Auteurs du script : Beunwa http://divioseo.fr/ & Tiger http://www.seoblackout.com
// Contributeurs émérites : Seg http://www.wagablog.com/ & Meuhsli http://www.thugeek.com/
// Url article du script pour bugs, commentaires... : http://www.seoblackout.com/2010/01/27/google-suggest/
?>
<form action="" method="post">
<table><tr><td>
Keyword : <textarea name="kw" rows="10"><?=strip_tags($_POST['kw'])?></textarea>
</td><td>
et <textarea name="mix2" rows="10"><?=strip_tags($_POST['mix2'])?></textarea>
</td><td>
<br />
Langue :
<select name="lang">
<option value="fr">FR</option>
<option value="en">EN</option>
</select>
<br />
Profondeur :
<select name="depth">
<option value="1">1</option>
<option value="2">2</option>
<option value="3">3</option>
<option value="4">4</option>
<option value="5">5</option>
</select>
<br />
Alphabet :<input type="checkbox" name="alph" />
</td></tr></table>
<br />
<input type="submit" value="Go" />
</form>
<?php
if(isset($_POST['kw'])){
$lang = strip_tags($_POST["lang"]);
if($lang == '') $lang = "fr";
$depth = strip_tags($_POST["depth"]);
if($depth == '') $depth = "1";
$kwsd = array();
$kwsd=explode("\n",trim(strip_tags($_POST["kw"])));
foreach ($kwsd as $lst) {
if($lst != "\n"){
//mots cles simple
ggSuggest($lst, $lang, $depth);
//mots cles avec compléments
$kws2 = array();
$kws2=explode("\n",strip_tags($_POST["mix2"]));
foreach ($kws2 as $mix2) {
ggSuggest($lst.$mix2, $lang, $depth);
}
//alphabet
if(strip_tags($_POST["alph"]) == "on"){
$alpha = "a";
while($alpha != "z"){
ggSuggest($lst.' '.$alpha, $lang, $depth);
$alpha = ++$alpha;
}
}
}
}
}
function ggSuggest($kw, $lang, $depth = 1, $inc = 1){
global $tabKw;
$tabKw[] = $kw;
$url = 'http://www.google.com/complete/search?hl='.$lang.'&js=true&qu='. urlencode($kw);
if (function_exists('curl_init')) {
$header = array(
"Accept: text/xml,application/xml,application/xhtml+xml,
text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5",
"Accept-Language: fr-fr,fr;q=0.7,en-us;q=0.5,en;q=0.3",
"Accept-Charset: utf-8;q=0.7,*;q=0.7",
"Keep-Alive: 300");
$ch = curl_init();
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_VERBOSE, true);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5);
curl_setopt($ch, CURLOPT_TIMEOUT, 5);
curl_setopt($ch, CURLOPT_REFERER, 'http://www.google.com/');
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)' );
curl_setopt($ch, CURLOPT_HTTPHEADER, $header );
curl_setopt($ch, CURLOPT_URL, $url);
$result=curl_exec ($ch);
curl_close ($ch);
} else {
$result= file_get_contents($url);
}
preg_match_all('/\["(.*?)",/si', $result, $kwgoogle, PREG_SET_ORDER);//mot
preg_match_all('/\,"(.*?)résultats",/si', $result, $nbresult, PREG_SET_ORDER);//nb resultats
if ($kwgoogle=='' || $inc > $depth) {
return $tabKw;
}else {
$ii = 0;
foreach($kwgoogle as $v){
$tk = utf8_decode(strip_tags($v[1]));
if(!in_array($tk, $tabKw)){
$tk = str_replace ('\r',"", $tk);
$kwr = utf8_decode($nbresult[$ii][1]);
if($kwr == "") $kwr = 0;
echo $kwr.' ; '.$tk.'<br />';
$ii++;
flush();
ggSuggest($tk, $lang, $depth, $inc+1);
}
}
}
return $tabKw;
}
?> |
Un grand merci à Seg (Wagablog – Google Analytics) et Meuhsli (Blog Geek) de l’agence référencement Résoneo, qui nous proposent ici une contribution majeure.
Merci encore une fois à Beunwa (Référencement Dijon), pour avoir contribué au développement du script Google Suggest.
Merci à eux 3 pour avoir accepté de partager publiquement et gratuitement avec vous ces améliorations !
Le web est un lieu de partage, keep this spirit !
A lire à propos de Google Suggest chez copains :
Catégorie: Google, Scripts PHP
Ecrit par lemoussel le Lundi 25 janvier 2010 à 22:15 - Catégorie Scraping, Scripts PHP
Nous avons vu dans nos différents articles comment extraire/parser le contenu d’une page en utilisant les expressions régulières. La difficulté de cette approche est la maitrise de la rédaction des expressions régulières.
Dans cet article, je vous propose d’essayer une autre méthode par l’utilisation des fonctions DOMDocument et DOMXPath de PHP 5.
La question qui se pose alors : Comment déterminer la structure DOM d’un document HTML ? Cela ne va t’il pas être plus compliqué que les expressions régulières ?
La réponse est non ! En effet avec le plug-in Firebug pour FireFox, l’exploration de la structure DOM d’une page HTML est très simple. Pour ce faire, nous allons reprendre l’exemple d’extraction des backlinks référencés par Alexa avec le petit blog de geektitude Insolite du Geek.
Sous FireBug, il suffit de sélectionner la première URL (1), le chemin Xpath s’affiche alors (2). Il nous suffit “Copier le chemin XPath” (3).

Nous obtenons le chemin XPath (2) suivant : /html/body/div/div/div[3]/div/div/div/div/div/ol/li/div/p/a
Et voilà le plus dur est fait ! Il suffit juste d’intégrer la requête XPath dans le script PHP suivant :
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
| <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>Scraping avec DOMDocument & DOMXpath</title>
</head>
<body>
<?php
// Alexa Sites Linking to Insolite-du-Geek
$url = 'http://www.alexa.com/site/linksin;0/www.insolite-du-geek.fr';
$queryXPath = '/html/body/div/div/div[3]/div/div/div/div/div/ol/li/div/p/a';
$dom = new DOMDocument();
@$dom->loadHTMLFile($url);
$x = new DOMXPath($dom);
$nodeList = $x->query($queryXPath );
foreach ($nodeList as $node)
echo utf8_decode(urldecode($node->nodeValue))."<br/>";
?>
</body>
</html> |
7 lignes de code PHP pour réaliser un scraping de page HTML.
Remarques :
- Noter la présence du @ devant la fonction loadHTMLFile(). Cela évite d’avoir les messages de Warning PHP de défaut de structure DOM du document HTML.
- J’ai remarqué que dans certains cas Firebug, insére pour la balise <table> la balise <tbody>. Cette balise n’étant pas présente dans le document, il faut la supprimer de la requête XPath sinon aucun résultat ne sera obtenu.
Sources :
W3C Recommendation : XPath 1.0 standard
Plus d’informations sur XPath : Xpath Tutorial
Catégorie: Scraping, Scripts PHP
Ecrit par admin le Mercredi 20 janvier 2010 à 12:20 - Catégorie Scripts PHP
Le script google suggest a été mis à jour, vous pouvez consulter la nouvelle version ici : Google suggest, mais avant, je vous suggère de consulter le texte ci-dessous.
Tout le monde ou presque connait Google Suggest, qui suggère automatiquement des termes de recherche au fur et à mesure que l’on saisit notre requête, à chaque fois que l’on tape une lettre supplémentaire, la liste est modifiée. Cet outil fournit également, à côté de chaque suggestion, une estimation du nombre de résultats sur google que renvoit chaque mot-clé de la liste.
Les mots-clés proposés correspondent « soit-disant » aux recherches que font fréquemment les internautes (d’où l’intérêt pour les référenceurs).

Le script Google suggest que nous vous proposons, permet à partir d’un mot-clé, de trouver toutes les suggestions faites par Google pour ce mot-clé et les mots-clés trouvés et ainsi de suite selon la profondeur d’analyse choisie.
Par exemple, si je saisis référencement, le script va extraire toutes les propositions de mots-clés en partant de référencement et pour chaque mot-clé trouvé, le script va à nouveau extraire les mots-clés correspondants et ainsi de suite.
Ce script va ensuite éliminer les doublons pour vous proposer une liste unique de mots-clés.
Script php Google suggest :
Copiez le code ci-dessous dans un fichier que vous nommez google-suggest.php par exemple et uploadez-le sur votre FTP, il vous suffit ensuite d’appeler ce fichier pour trouver un max de mots-clés pour votre long tail
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
| <?php
//Script Google Suggest by http://www.seoblackout.com
// Auteurs du script : Beunwa http://divioseo.fr/ & Tiger http://www.seoblackout.com
// Url article du script pour bugs, commentaires... : http://www.seoblackout.com/2010/01/20/referencement-google-suggest/
//le script affiche les resultats au fur et a mesure mais les renvois aussi dans un tableau au besoin
?>
<form action="" method="post">
Keyword : <input name="kw" type="text" value="<?php echo strip_tags($_POST['kw']); ?>" />
<br />
Langue :
<select name="lang">
<option value="fr">FR</option>
<option value="en">EN</option>
</select>
<br />
Profondeur :
<select name="depth">
<option value="1">1</option>
<option value="2">2</option>
<option value="3">3</option>
<option value="4">4</option>
<option value="5">5</option>
</select>
<br />
<input type="submit" value="Go" />
</form>
<?php
if(isset($_POST['kw'])){
$kw = strip_tags(utf8_encode($_POST["kw"]));
$lang = strip_tags($_POST["lang"]);
if($lang == '') $lang = "fr";
$depth = strip_tags($_POST["depth"]);
if($depth == '') $depth = "1";
ggSuggest($kw, $lang, $depth);
}
function ggSuggest($kw, $lang, $depth = 1, $inc = 1){
global $tabKw;
$tabKw[] = $kw;
$url = 'http://www.google.com/complete/search?hl='.$lang.'&js=true&qu='. urlencode($kw);
if (function_exists('curl_init')) {
$header = array(
"Accept: text/xml,application/xml,application/xhtml+xml,
text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5",
"Accept-Language: fr-fr,fr;q=0.7,en-us;q=0.5,en;q=0.3",
"Accept-Charset: utf-8;q=0.7,*;q=0.7",
"Keep-Alive: 300");
$ch = curl_init();
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_VERBOSE, true);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5);
curl_setopt($ch, CURLOPT_TIMEOUT, 5);
curl_setopt($ch, CURLOPT_REFERER, 'http://www.google.com/');
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)' );
curl_setopt($ch, CURLOPT_HTTPHEADER, $header );
curl_setopt($ch, CURLOPT_URL, $url);
$result=curl_exec ($ch);
curl_close ($ch);
} else {
$result= file_get_contents($url);
}
preg_match_all('/\["(.*?)",/si', $result, $kwgoogle, PREG_SET_ORDER);
if ($kwgoogle=='' || $inc > $depth) {
return $tabKw;
}else {
foreach($kwgoogle as $v){
$tk = utf8_decode(strip_tags($v[1]));
if(!in_array($tk, $tabKw)){
echo $tk.'<br />';
flush();
ggSuggest($tk, $lang, $depth, $inc+1);
}
}
}
return $tabKw;
}
?> |
Démo du script Google Suggest :
Pas de démo en ligne, par contre voici le résultat obtenu pour la recherche référencement :
- référencement
- referencement
- referencement gratuit
- referencement gratuit automatique
- referencement gratuit google
- referencement gratuit sans lien retour
- referencement gratuit site web
- referencement gratuit sur google
- referencement gratuit moteurs de recherche
- referencement gratuit blog
- referencement gratuit sans lien de retour
- referencement gratuit annuaire
- referencement gratuit yahoo
- referencement google
- referencement google gratuit
- referencement google gratuite
- referencement google site
- referencement google sitemap
- referencement google sites
- referencement google site internet
- referencement google site joomla
- referencement google maps
- referencement google prix
- referencement google joomla
- referencement google payant
- referencement google flash
- referencement-google.fr
- referencement google tarif
- referencement google tarifs
- referencement newsgroup
- referencement newsgroups
- referencement newsgroup francais
- referencement newsgroup binaire
- referencement newsgroup binaires
- referencement newsgroup fr
- referencement newsgroup free
- referencement newsgroup gratuit
- referencement newsgroupe
- referencement newsgroup us
- référencement naturel
- référencement naturel définition
- referencement naturel google
- referencement naturel google gratuit
- référencement naturel seo
- référencement naturel comment ça marche
- référencement naturel et payant
- référencement naturel payant
- référencement naturel blog
- référencement naturel internet
- référencement naturel joomla
- referencement naturel sur google
- referencement yahoo
- referencement yahoo gratuit
- referencement yahoo.fr
- referencement site internet
- referencement site internet gratuit
- referencement site internet google
- referencement site internet bordeaux
- referencement.com
- referencement.com group
- referencement.com boursorama
- referencement site web
- referencement site web gratuit
- referencement site web google
- referencement site web tunisie
- referencement site web pdf
- referencement site
- referencement site google
- referencement site google gratuit
- referencement site flash
- referencement site joomla
- referencement site iweb
- referencement site free
- référencement définition
- référencement définition marketing
- referencement blog
- referencement blog gratuit
- referencement blog google
- referencement blog wordpress
- référencement blogs
- referencement blogspot
- referencement web
- referencement web gratuit
- referencement webmaster
- referencement webradio
- referencement web maroc
- référencement webdev
- referencement webrankinfo
- referencement web 2.0
- referencement web tuto
- referencement web wikipedia
- référencement payant
- référencement payant définition
- referencement payant google
- référencement payant prix
Un grand merci à Beunwa du site Création de site Dijon qui a largement amélioré le script de départ
Catégorie: Scripts PHP
Ecrit par Robin le Mardi 29 décembre 2009 à 21:54 - Catégorie Outils référencement, Scripts PHP
Créez votre annuaire optimisé pour le référencement en 20 secondes, c’est maintenant possible.
Nous avons tous un vieux domaine qui traîne avec un contenu pas tellement clean qui n’est pas forcément au top sur les moteurs de recherches. Alors pourquoi ne pas installer un annuaire ?
Freeglobes, Arfoo, MyDir … Non mieux Bartemis ! Vous n’en avez jamais entendu parler ? C’est normal cet annuaire est sorti il y a seulement quelques jours tout droit des mains d’un spécialiste du référencement.
Vous l’aurez donc compris ce script d’annuaire est nativement optimisé pour le référencement et n’oublie aucun détail des metas au duplicate content en passant par l’url rewriting.
L’aspect référencement n’est pas le seul atout de ce script :
- il se veut aussi très léger et simple à utiliser,
- il présente aussi une page d’installation automatique vous permettant de l’installer en 20 secondes chrono si vous avez vos identifiants mysql sous la main.
- Cet installeur vous ajoute directement du contenu unique vous permettant de ne pas partir de zéro.
- Le développement et les modifications sont toutes aussi simple que l’installation, car que ce soit pour une intégration ou pour l’ajout d’un module vous ne passerez pas deux heures à chercher où mettre votre code car il est classé par page dans un seul fichier.
Si cette petite présentation vous a donné envie de créer votre annuaire avec Bartemis alors ne tardez plus et rendez vous sur Bartemis.com. Pour ceux étant encore dubitatif sur le script, je vous invite à consulter une des nombreuses démos que j’ai installé.
Je suis ouvert à tous vos conseils ou demandes de modifications et attends vos feedbacks en masse que ce soit dans les commentaires de ce billet ou sur le forum. Je conseille aussi aux éditeur d’annuaire, d’ajouter leur annuaire dans l’annuaire des annuaires
Billet écrit par Robin, développeur du script Bartemis.
Catégorie: Outils référencement, Scripts PHP
Ecrit par Inglourious Seo le Mardi 22 décembre 2009 à 14:24 - Catégorie Backlinks, Scraping
Bonjour à tous !
Je me présente, Aldo du nouveau black hat seo blog Inglourious-seo.com, je m’incruste ici pour vous présenter un superbe outil et me faire un peu de promo, donc si vous avez aimé cet article, inscrivez-vous vite à mon flux rss et suivez-moi sur twitter si vous êtes intéressé par l’utilisation de soft de spam.
Je pense que comme moi vous avez été nombreux à vous retrouver en galère d’un bon url harvester / scraper depuis que l’excellent scrape genious n’est plus maintenu à jour.
Je vous propose de découvrir un outil récent qui fait bien plus encore (manque que l’extraction des pr), mais les fonctions complémentaires sont bien plus intéressantes…
Pourquoi scraper des urls ?

Il faut savoir que l’on a tous tendance à systématiquement laisser des empreintes lorsque l’on fait des sites et plus encore quand c’est opensource.
Dès lors, on peut retrouver sur le net, le même script de guestbook sur des milliers de sites web.
Trouvez son empreinte (footprint ou dork pour le hacking) et vous obtiendrez la liste de tous les sites utilisants le script de guestbook vulnérable au dofollow.
Un exemple dépassé : « leave a reply » « powered by wordress » pour trouver des formulaires de commentaires Wordpress sur Google.
Comme vous le voyez dans la capture d’écran, quelques footprints par défaut, sont disponibles avec le scrapebox.
Recherche et vérification des proxies automatiques

Si vous scrapez plus de 1000 urls chez Google, votre ip sera bannie à coup sûre, il faut donc la renouveler pour obtenir des milliers d’urls.
Scrape box se charge de vous les fournir à la demande et de les vérifier en temps réel.
Organisez vos listes, triez-les et vérifiez leur pagerank

Ces fonctions non indispensables sont néanmoins extrêmement utiles, vous pouvez :
- dédoublonner les urls
- dédoublonner les domaines
- Vérifier leur pagerank
- exporter/importer les listes
Référencement : Un outil à backlinks en plus ?
Spam de referer

Je n’oserai vous expliquer ce qu’est le spam de referer, vous trouverez plus d’informations à ce sujet ici , ça et là
Spam auto de commentaires

Vous avez la possibilité de “randomiser” pseudo, adresse mail, site et les commentaires via content spinning.
Assurez-vous de l’indexation de vos splogs créés via LFE en quelques minutes grâce au ping

Trackback Spammer

Bien qu’existante depuis plus d’un an, cette tactique est encore peu utilisée, envoyez un trackback aux bons endroits vous permet de gratter encore des liens dofollow (si vous savez où les trouver).
Plus de screenshots ?

Rendez-vous sur le site de l’éditeur : http://www.scrapebox.com/screenshots et la page de vente est là : http://www.scrapebox.com/
Catégorie: Backlinks, Scraping