FAQ Référencement

Google Suggest – Script php (Nouvelle version)

Ecrit par admin le Mercredi 27 janvier 2010 à 14:25 - Catégorie Google, Scripts PHP

Il y a quelques jours, nous vous présentions un outil nommé Google Suggest php script permettant d’extraire les suggestions proposées par Google à partir d’un mot-clé, les résultats ainsi obtenus étaient à nouveau extraits et ainsi de suite selon le niveau de profondeur défini par l’utilisateur du script (jusqu’à 5 niveaux).

Et bien, aujourd’hui nous vous proposons en plus les options suivantes :

  • Gestion de listes de mots
  • Intégration de mots mixés
  • Test de mots + lettres de l’alphabet
  • Récupération du nombre de résultats

Voici le script php google suggest nouvelle version :

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
<?php
//Script Google Suggest by http://www.seoblackout.com
// Auteurs du script : Beunwa http://divioseo.fr/ & Tiger http://www.seoblackout.com
// Contributeurs émérites : Seg http://www.wagablog.com/ & Meuhsli http://www.thugeek.com/
// Url article du script pour bugs, commentaires... : http://www.seoblackout.com/2010/01/27/google-suggest/
?>
<form  action="" method="post">
	<table><tr><td>
		Keyword : <textarea name="kw" rows="10"><?=strip_tags($_POST['kw'])?></textarea>
	</td><td>
		et <textarea name="mix2" rows="10"><?=strip_tags($_POST['mix2'])?></textarea>
	</td><td>
		<br />
		Langue : 
		<select name="lang">
			<option value="fr">FR</option>
			<option value="en">EN</option>
		</select>
		<br />
		Profondeur : 
		<select name="depth">
			<option value="1">1</option>
			<option value="2">2</option>
			<option value="3">3</option>
			<option value="4">4</option>
			<option value="5">5</option>
		</select>  
		<br />
		Alphabet :<input type="checkbox" name="alph" />
	</td></tr></table>
	<br />
	<input type="submit" value="Go" />
</form>
<?php
if(isset($_POST['kw'])){
	$lang = strip_tags($_POST["lang"]);
	if($lang == '') $lang = "fr"; 
	$depth = strip_tags($_POST["depth"]);
	if($depth == '') $depth = "1";
 
	$kwsd = array();
	$kwsd=explode("\n",trim(strip_tags($_POST["kw"])));
	foreach ($kwsd as $lst) {
		if($lst != "\n"){
			//mots cles simple
			ggSuggest($lst, $lang, $depth);
 
			//mots cles avec compléments
			$kws2 = array();
			$kws2=explode("\n",strip_tags($_POST["mix2"]));
			foreach ($kws2 as $mix2) {
				ggSuggest($lst.$mix2, $lang, $depth);
			}
 
			//alphabet
			if(strip_tags($_POST["alph"]) == "on"){
				$alpha = "a";
				while($alpha != "z"){
					ggSuggest($lst.' '.$alpha, $lang, $depth);
					$alpha = ++$alpha;
				}
			}
		}
	}
 
}
 
function ggSuggest($kw, $lang, $depth = 1, $inc = 1){	
	global $tabKw;
 
	$tabKw[] = $kw;	
    $url = 'http://www.google.com/complete/search?hl='.$lang.'&js=true&qu='. urlencode($kw);
	if (function_exists('curl_init')) {
	$header = array(
        "Accept: text/xml,application/xml,application/xhtml+xml,
		text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5",
        "Accept-Language: fr-fr,fr;q=0.7,en-us;q=0.5,en;q=0.3",
        "Accept-Charset: utf-8;q=0.7,*;q=0.7",
        "Keep-Alive: 300");
		$ch = curl_init();
	    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false);
	    curl_setopt($ch, CURLOPT_HEADER, false);
	    curl_setopt($ch, CURLOPT_VERBOSE, true);	
	    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
	    curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5);
	    curl_setopt($ch, CURLOPT_TIMEOUT, 5);
	    curl_setopt($ch, CURLOPT_REFERER, 'http://www.google.com/');
	    curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)' );
	    curl_setopt($ch, CURLOPT_HTTPHEADER, $header );
	 	curl_setopt($ch, CURLOPT_URL, $url);
		$result=curl_exec ($ch);
		curl_close ($ch);
	} else {
		$result= file_get_contents($url);
	}
	preg_match_all('/\["(.*?)",/si', $result, $kwgoogle, PREG_SET_ORDER);//mot
	preg_match_all('/\,"(.*?)résultats",/si', $result, $nbresult, PREG_SET_ORDER);//nb resultats
 
	if ($kwgoogle=='' || $inc > $depth) {
		return $tabKw;
	}else {
		$ii = 0;
		foreach($kwgoogle as $v){	
			$tk = utf8_decode(strip_tags($v[1]));
			if(!in_array($tk, $tabKw)){ 
				$tk = str_replace ('\r',"", $tk);
				$kwr = utf8_decode($nbresult[$ii][1]);
				if($kwr == "") $kwr = 0;
				echo $kwr.' ; '.$tk.'<br />';
				$ii++;
				flush();
				ggSuggest($tk, $lang, $depth, $inc+1); 
			}
		}
	}
	return $tabKw;
}
?>

Un grand merci à  Seg (Wagablog – Google Analytics) et Meuhsli (Blog Geek) de l’agence référencement Résoneo, qui nous proposent ici une contribution majeure. 

Merci encore une fois à Beunwa (Référencement Dijon), pour avoir contribué au développement du script Google Suggest. 

Merci à eux 3 pour avoir accepté de partager publiquement et gratuitement avec vous ces améliorations !

Le web est un lieu de partage, keep this spirit !

A lire à propos de Google Suggest chez copains :

Commentaires (19)

Catégorie: Google, Scripts PHP

Php Scraping avec fonctions DOM et Xpath

Ecrit par lemoussel le Lundi 25 janvier 2010 à 22:15 - Catégorie Scraping, Scripts PHP

Nous avons vu dans nos différents articles comment extraire/parser le contenu d’une page en utilisant les expressions régulières. La difficulté de cette approche est la maitrise de la rédaction des expressions régulières.

Dans cet article, je vous propose d’essayer une autre méthode par l’utilisation des fonctions DOMDocument et DOMXPath de PHP 5.

La question qui se pose alors : Comment déterminer la structure DOM d’un document HTML ?  Cela ne va t’il pas être plus compliqué que les expressions régulières ?

La réponse est non ! En effet avec le plug-in Firebug pour FireFox, l’exploration de la structure DOM d’une page HTML est très simple. Pour ce faire, nous allons reprendre l’exemple d’extraction des  backlinks référencés par Alexa avec le petit blog de geektitude Insolite du Geek.

Sous FireBug, il suffit de sélectionner la première URL (1), le chemin Xpath s’affiche alors (2). Il nous suffit “Copier le chemin XPath” (3).

Nous obtenons le chemin XPath (2) suivant :  /html/body/div/div/div[3]/div/div/div/div/div/ol/li/div/p/a

Et voilà le plus dur est fait ! Il suffit juste d’intégrer la requête XPath dans le script PHP suivant :

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
 
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
    <title>Scraping avec DOMDocument & DOMXpath</title>
</head>
<body>
<?php
// Alexa Sites Linking to Insolite-du-Geek
$url = 'http://www.alexa.com/site/linksin;0/www.insolite-du-geek.fr';
$queryXPath = '/html/body/div/div/div[3]/div/div/div/div/div/ol/li/div/p/a';
 
$dom = new DOMDocument();
@$dom->loadHTMLFile($url);
$x = new DOMXPath($dom);
$nodeList = $x->query($queryXPath );
foreach ($nodeList as $node) 
	echo utf8_decode(urldecode($node->nodeValue))."<br/>";
?>
</body>
</html>

7 lignes de code PHP pour réaliser un scraping de page HTML.

Remarques :

  1. Noter la présence du @ devant la fonction loadHTMLFile(). Cela évite d’avoir les messages de Warning PHP de défaut de structure DOM du document HTML.
  2. J’ai remarqué que dans certains cas Firebug, insére pour la balise <table> la balise <tbody>. Cette balise n’étant pas présente dans le document, il faut la supprimer de la requête XPath sinon aucun résultat ne sera obtenu.

Sources :

W3C Recommendation : XPath 1.0 standard

Plus d’informations sur XPath : Xpath Tutorial

Commentaires (13)

Catégorie: Scraping, Scripts PHP

Référencement : Google Suggest script PHP

Ecrit par admin le Mercredi 20 janvier 2010 à 12:20 - Catégorie Scripts PHP

Le script google suggest a été mis à jour, vous pouvez consulter la nouvelle version ici : Google suggest, mais avant, je vous suggère de consulter le texte ci-dessous.

Tout le monde ou presque connait Google Suggest, qui suggère automatiquement des termes de recherche au fur et à mesure que l’on saisit notre requête, à chaque fois que l’on tape une lettre supplémentaire, la liste est modifiée. Cet outil fournit également, à côté de chaque suggestion, une estimation du nombre de résultats sur google que renvoit chaque mot-clé de la liste.

Les mots-clés proposés correspondent « soit-disant » aux recherches que font fréquemment les internautes (d’où l’intérêt pour les référenceurs).

Google Suggest

Le script Google suggest que nous vous proposons, permet à partir d’un mot-clé, de trouver toutes les suggestions faites par Google pour ce mot-clé et les mots-clés trouvés et ainsi de suite selon la profondeur d’analyse choisie.

Par exemple, si je saisis référencement, le script va extraire toutes les propositions de mots-clés en partant de référencement et pour chaque mot-clé trouvé, le script va à nouveau extraire les mots-clés correspondants et ainsi de suite.
Ce script va ensuite éliminer les doublons pour vous proposer une liste unique de mots-clés.

Script php Google suggest :

Copiez le code ci-dessous dans un fichier que vous nommez google-suggest.php par exemple et uploadez-le sur votre FTP, il vous suffit ensuite d’appeler ce fichier pour trouver un max de mots-clés pour votre long tail :)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
<?php
//Script Google Suggest by http://www.seoblackout.com
// Auteurs du script : Beunwa http://divioseo.fr/ & Tiger http://www.seoblackout.com
// Url article du script pour bugs, commentaires... : http://www.seoblackout.com/2010/01/20/referencement-google-suggest/
//le script affiche les resultats au fur et a mesure mais les renvois aussi dans un tableau au besoin
?>
<form  action="" method="post">
	Keyword : <input name="kw" type="text" value="<?php echo strip_tags($_POST['kw']); ?>" />
	<br />
	Langue : 
	<select name="lang">
		<option value="fr">FR</option>
		<option value="en">EN</option>
	</select>
	<br />
	Profondeur : 
	<select name="depth">
		<option value="1">1</option>
		<option value="2">2</option>
		<option value="3">3</option>
		<option value="4">4</option>
		<option value="5">5</option>
	</select>
	<br />
	<input type="submit" value="Go" />
</form>
<?php
if(isset($_POST['kw'])){
	$kw = strip_tags(utf8_encode($_POST["kw"]));
	$lang = strip_tags($_POST["lang"]);
	if($lang == '') $lang = "fr";
	$depth = strip_tags($_POST["depth"]);
	if($depth == '') $depth = "1";
 
	ggSuggest($kw, $lang, $depth);
}
 
function ggSuggest($kw, $lang, $depth = 1, $inc = 1){	
	global $tabKw;
 
	$tabKw[] = $kw;	
    $url = 'http://www.google.com/complete/search?hl='.$lang.'&js=true&qu='. urlencode($kw);
	if (function_exists('curl_init')) {
	$header = array(
        "Accept: text/xml,application/xml,application/xhtml+xml,
		text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5",
        "Accept-Language: fr-fr,fr;q=0.7,en-us;q=0.5,en;q=0.3",
        "Accept-Charset: utf-8;q=0.7,*;q=0.7",
        "Keep-Alive: 300");
		$ch = curl_init();
	    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, false);
	    curl_setopt($ch, CURLOPT_HEADER, false);
	    curl_setopt($ch, CURLOPT_VERBOSE, true);	
	    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
	    curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5);
	    curl_setopt($ch, CURLOPT_TIMEOUT, 5);
	    curl_setopt($ch, CURLOPT_REFERER, 'http://www.google.com/');
	    curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)' );
	    curl_setopt($ch, CURLOPT_HTTPHEADER, $header );
	 	curl_setopt($ch, CURLOPT_URL, $url);
		$result=curl_exec ($ch);
		curl_close ($ch);
	} else {
		$result= file_get_contents($url);
	}
	preg_match_all('/\["(.*?)",/si', $result, $kwgoogle, PREG_SET_ORDER);
 
	if ($kwgoogle=='' || $inc > $depth) {
		return $tabKw;
	}else {
		foreach($kwgoogle as $v){	
			$tk = utf8_decode(strip_tags($v[1]));
			if(!in_array($tk, $tabKw)){ 
				echo $tk.'<br />';
				flush();
				ggSuggest($tk, $lang, $depth, $inc+1);
			}
		}
	}
	return $tabKw;
}
 
?>

Démo du script Google Suggest :

Pas de démo en ligne, par contre voici le résultat obtenu pour la recherche référencement :

  • référencement
  • referencement
  • referencement gratuit
  • referencement gratuit automatique
  • referencement gratuit google
  • referencement gratuit sans lien retour
  • referencement gratuit site web
  • referencement gratuit sur google
  • referencement gratuit moteurs de recherche
  • referencement gratuit blog
  • referencement gratuit sans lien de retour
  • referencement gratuit annuaire
  • referencement gratuit yahoo
  • referencement google
  • referencement google gratuit
  • referencement google gratuite
  • referencement google site
  • referencement google sitemap
  • referencement google sites
  • referencement google site internet
  • referencement google site joomla
  • referencement google maps
  • referencement google prix
  • referencement google joomla
  • referencement google payant
  • referencement google flash
  • referencement-google.fr
  • referencement google tarif
  • referencement google tarifs
  • referencement newsgroup
  • referencement newsgroups
  • referencement newsgroup francais
  • referencement newsgroup binaire
  • referencement newsgroup binaires
  • referencement newsgroup fr
  • referencement newsgroup free
  • referencement newsgroup gratuit
  • referencement newsgroupe
  • referencement newsgroup us
  • référencement naturel
  • référencement naturel définition
  • referencement naturel google
  • referencement naturel google gratuit
  • référencement naturel seo
  • référencement naturel comment ça marche
  • référencement naturel et payant
  • référencement naturel payant
  • référencement naturel blog
  • référencement naturel internet
  • référencement naturel joomla
  • referencement naturel sur google
  • referencement yahoo
  • referencement yahoo gratuit
  • referencement yahoo.fr
  • referencement site internet
  • referencement site internet gratuit
  • referencement site internet google
  • referencement site internet bordeaux
  • referencement.com
  • referencement.com group
  • referencement.com boursorama
  • referencement site web
  • referencement site web gratuit
  • referencement site web google
  • referencement site web tunisie
  • referencement site web pdf
  • referencement site
  • referencement site google
  • referencement site google gratuit
  • referencement site flash
  • referencement site joomla
  • referencement site iweb
  • referencement site free
  • référencement définition
  • référencement définition marketing
  • referencement blog
  • referencement blog gratuit
  • referencement blog google
  • referencement blog wordpress
  • référencement blogs
  • referencement blogspot
  • referencement web
  • referencement web gratuit
  • referencement webmaster
  • referencement webradio
  • referencement web maroc
  • référencement webdev
  • referencement webrankinfo
  • referencement web 2.0
  • referencement web tuto
  • referencement web wikipedia
  • référencement payant
  • référencement payant définition
  • referencement payant google
  • référencement payant prix

Un grand merci à Beunwa du site Création de site Dijon qui a largement amélioré le script de départ ;)

Commentaires (41)

Catégorie: Scripts PHP

Script annuaire optimisé pour le référencement

Ecrit par Robin le Mardi 29 décembre 2009 à 21:54 - Catégorie Outils référencement, Scripts PHP

Créez votre annuaire optimisé pour le référencement en 20 secondes, c’est maintenant possible.

Nous avons  tous un vieux domaine qui traîne avec un contenu pas tellement clean qui n’est pas forcément au top sur les moteurs de recherches. Alors pourquoi ne pas installer un annuaire ?

Freeglobes, Arfoo, MyDir … Non mieux Bartemis ! Vous n’en avez jamais entendu parler ? C’est normal cet annuaire est sorti il y a seulement quelques jours tout droit des mains d’un spécialiste du référencement.

Vous l’aurez donc compris ce script d’annuaire est nativement optimisé pour le référencement et n’oublie aucun détail des metas au duplicate content en passant par l’url rewriting.

L’aspect référencement n’est pas le seul atout de ce script :

  • il se veut aussi très léger et simple à utiliser,
  • il présente aussi une page d’installation automatique vous permettant de l’installer en 20 secondes chrono si vous avez vos identifiants mysql sous la main.
  • Cet installeur vous ajoute directement  du contenu unique vous permettant de ne pas partir de zéro.
  • Le développement et les modifications sont toutes aussi simple que l’installation, car que ce soit pour une intégration ou pour l’ajout d’un module vous ne passerez pas deux heures à chercher où mettre votre code car il est classé par page dans un seul fichier.

Si cette petite présentation vous a donné envie de créer votre annuaire avec Bartemis alors ne tardez plus et rendez vous sur Bartemis.com. Pour ceux étant encore dubitatif sur le script, je vous invite à consulter une des nombreuses démos que j’ai installé.

Je suis ouvert à tous vos conseils ou demandes de modifications et attends vos feedbacks en masse que ce soit dans les commentaires de ce billet ou sur le forum. Je conseille aussi aux éditeur d’annuaire, d’ajouter leur annuaire dans l’annuaire des annuaires ;-)

Billet écrit par Robin, développeur du script Bartemis.

Commentaires (18)

Catégorie: Outils référencement, Scripts PHP

Alexa Keywords PHP Script

Ecrit par lemoussel le Vendredi 25 septembre 2009 à 11:23 - Catégorie Outils référencement, Scripts PHP

Alexa propose une option permettant de lister, pour un site donné, les mots-clés ayant générés le plus de trafic pour ce site mais aussi les mots-clés générant le plus de trafic de façon globale par rapport à l’ensemble des sites.
Cette fonctionnalité corrélée aux résultats de recherche google permet d’obtenir une liste de mots-clés générant du trafic sur un thème donné.

Exemple : quels sont les mots-clés générant le plus de trafic pour le mot-clé référencement ?
Après un tri rapide dans excel et élimination de certains résultats et des doublons, on obtient ce type de liste à partir du script :

  • achat de mots clés
  • achat mot clé
  • agence de référencement
  • agence référencement
  • annuaire
  • balise canonique
  • c class ip
  • conseil seo
  • creation site internet paris
  • creation site web ethique
  • data center google
  • devis référencement
  • echange de lien
  • echange de lien automatique
  • echange de liens
  • echange de script
  • expert référencement
  • generateur de meta
  • générateur de mots clés
  • generateur mot clé
  • google bombing
  • google dance
  • google image
  • google news
  • indice de popularité
  • indice de popularité du site
  • indice de popularité google
  • keyword stuffing
  • liste moteur de recherche
  • meta keywords
  • moteur de recherche
  • moteurs de recherche
  • page rank
  • pages rank
  • redirection javascript
  • redirection php
  • référencement
  • référencement google
  • référencement gratuit
  • referencement internet
  • referencement naturel
  • referencement professionnel
  • referencement site
  • referencement site internet
  • referencement site web
  • referencement web
  • référencer gratuit
  • robots.txt generator

A partir de mots-clés saisis, ce script va extraire les n premiers résultats de Google et pour chaque résultat, il extrait les mots-clés référencés par Alexa.

Exemple des mots-clés issus d’Alexa pour SEO BlackOut :

Rem : J’ai repris le chiffre du source HTML et additionné si présence de 2 fois le mot-clé. Ce chiffre qualifiant l’importance du mot-clé pour Alexa .

    www.seoblackout.com

      seo => 200
      black hat seo => 171.356
      referencement google => 104.864
      captcha bypass => 74.998
      black seo => 70.6
      blog seo => 59.976
      google image => 58.492
      seoblackout => 54.128
      seo black hat => 45.8
      google wonder wheel => 19.684
      curl php => 13.876
      wonder wheel => 11.39
      script php => 9.814
      black hat => 8.552
      curl => 8.242
      freeglobes => 7.617
      yacg => 7.104
      racheumeuneu => 6.752
      suggestion mot clé => 5.796
      phpscript => 5.491

Code source du script d’extraction des mots-clés référencés par Alexa :
Ci-dessous le code du script php à copier/coller dans un fichier et à télécharger sur votre serveur ou à utiliser en local :

» Lire la suite : Alexa Keywords PHP Script

Commentaires (44)

Catégorie: Outils référencement, Scripts PHP

Proxy : script PHP détection de Proxy

Ecrit par lemoussel le Samedi 29 août 2009 à 13:47 - Catégorie Proxies, Scripts PHP

Comment détecter le type d’anonymat d’un seveur proxy ?

Il nous arrive de temps en temps de nous retrouver aux prises avec des robots de spam agissant de manière douteuse sur notre site web. Afin d’être anonyme et éviter le blocage au niveau de leur adresse IP, ceux-ci utilisent des serveurs proxies.

Il existe 3 grands type de serveur proxy :

    – Transparent proxy : on sait que la requête HTTP vient d’un proxy et on peut connaitre connaître la véritable adresse du visiteur.
    – Anonymous proxy : on sait que la requête HTTP vient d’un proxy mais on ne peut connaitre la véritable adresse du visiteur.
    – High anonymous (elite) proxy : Impossible de déterminer l’utilisation d’un proxy et impossibilité de connaitre l’adresse IP du visiteur. Le must !

J’ai remarqué que bon nombre d’outils de spam utilisent des proxies « transparent » (les « transparent proxy » sont les plus répandus). Il suffit donc de détecter ce type de proxy afin de récupérer la véritable adresse IP du visiteur (l’adresse IP est adressée dans les requêtes HTTP par l’entête X-Forwarded-For). De la sorte il sera possible d’appliquer une interdiction d’accès au site pour cette adresse IP.

Ci-dessous le code d’un script php permettant de détecter l’utilisation et le type d’un Proxy à copier/coller dans un fichier et à télécharger sur votre serveur ou à utiliser en local :

» Lire la suite : Proxy : script PHP détection de Proxy

Commentaires (23)

Catégorie: Proxies, Scripts PHP

Script PHP Spam Referer

Ecrit par lemoussel le Lundi 24 août 2009 à 14:22 - Catégorie Outils de spam, Scripts PHP

En complément de l’article Spam referers liens Edu et Gov, je vous propose ce script PHP montrant comment les spammeurs effectuent du spam referer.

Remarque :Cet article est purement éducatif et à titre de démonstration sur l’utilisation de Curl avec PHP. L’exploitation de ce script qui y est décrit est à vos risques et périls. Spammer les referers peut avoir l’effet inverse de celui escompté…

Ce script que j’ai nommé SpamRef est un outil qui simule des visites sur le site cible (sur lequel on veut faire du spam referrer).
Deux paramètres sont demandés lors de son exécution :

    1) L’url du site « referer ».
    2) Nombre de visites à effectuer sur le site.

Les URL des sites à « visiter » doivent être stockées dans un fichier nommé URLspam.csv.

Code source du script SpamRef :

» Lire la suite : Script PHP Spam Referer

Commentaires (26)

Catégorie: Outils de spam, Scripts PHP

Extraire les urls des résultats de Bing

Ecrit par lemoussel le Vendredi 14 août 2009 à 13:54 - Catégorie Scripts PHP

Comment extraire / parser les urls de résultats de recherche de BING ?
Pour faire suite à l’article « Comment extraire / parser les urls de résultats de recherche de Google ?« , voici le même genre de script PHP permettant d’extraire des urls du moteur de recherche Bing.

Ci-dessous le code du script php à copier/coller dans un fichier et à télécharger sur votre serveur ou à utiliser en local.

» Lire la suite : Extraire les urls des résultats de Bing

Commentaires (18)

Catégorie: Scripts PHP

Extraire les backlinks référencés par Alexa

Ecrit par lemoussel le Mercredi 5 août 2009 à 23:07 - Catégorie Scripts PHP

Comment extraire / parser les backlinks référencés par Alexa ?
Voici un script php permettant d’extraire, du site Alexa, la liste des sites qui mentionnent votre blog/site avec un backlink (un backlink ou “lien retour” est un lien qui pointe vers votre site).

Ainsi avec ce script vous saurez rapidement qui vous cite à la réserve près que dans cette liste n’apparait que les backlinks identifiés par Alexa (par curiosité regardez pour www.seoblackout.com).

» Lire la suite : Extraire les backlinks référencés par Alexa

Commentaires (8)

Catégorie: Scripts PHP

Google Wonder Wheel PHP Script

Ecrit par admin le Samedi 13 juin 2009 à 14:27 - Catégorie Google, Scripts PHP

Google a sorti, de son lab., il y a quelques semaines maintenant, une option nommée Google Wonder Wheel qui permet à partir d’un mot-clé donné de trouver des mots-clés connexes qui ont un lien sémantique avec le mot-clé recherché. Les résultats sont présentés sous forme cartographique dans une animation flash.

Cette fonctionnalité n’est pas disponible dans toutes les langues pour le moment, on la retrouve sur google.com, google.cn et certainement d’autres mais pas sur google.fr

Il est quand même possible d’obtenir des résultats pour des mots français, on peut saisir un mot-clé uniquement français, par exemple, poker retournera des mots apparentés anglais, alors que poker gratuit retournera des mots-clés connexes français, les mots avec accents renverront des mots-clés français, exemple crédit versus credit.

Voici quelques screenshots pour voir la Google Wonder Wheel en action :

Pour accéder à Google Wonder Wheel, il faut aller sur google.com et cliquer sur show options :

show options google

Ensuite on clique sur wonder wheel (colonne de gauche vers le bas) et on saisit notre mot-clé, ici je prend comme exemple référencement :

referencement

Je clique ensuite sur référencement google :
referencement google

Puis je clique sur référencement manuel :
referencement manuel

Il faut savoir que les mots-clés présents dans le flash sont présents dans le code source de la page, donc il est aisé d’extraire ces mots-clés apparentés :)

Voici le script php qui permet d’extraire ces mots-clés :

A partir d’un mot-clé donné, ce script va extraire, pour chaque mot-clé de la roue, tous les mots-clés apparentés :

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
<?php
//Script Auteur : Tiger
//Site Web : http://www.seoblackout.com
//Url script :  http://www.seoblackout.com/2009/06/13/google-wonder-wheel/
//Description script : Ce script php vous permet d'extraire pour un mot-clé donné, les mots-clés connexes à partir de Google Wonder Wheel
//Installation : uploader ce fichier sur votre serveur et appeler le ainsi : http://votre_site_web.com/google-wheel.php?kw=votre mot clé
 
if ((isset($_GET['kw'])) && $_GET['kw']!='')
{
	$q=strip_tags($_GET['kw']);
	echo google_wheel($q);
}
else
{
	echo 'Veuillez saisir un mot-clé !';
}
function google_wheel($q) {
 
$q=urlencode($q);
$search_url="http://www.google.com/search?q=$q&hl=en&tbo=1&tbs=ww:1";
	$ch = curl_init();
	curl_setopt($ch, CURLOPT_USERAGENT, 'Opera/9.63 (Windows NT 5.1; U; fr) Presto/2.1.1');
	curl_setopt($ch, CURLOPT_URL,$search_url);
	curl_setopt($ch, CURLOPT_FAILONERROR, true);
	curl_setopt($ch, CURLOPT_REFERER, $search_url);
	curl_setopt($ch, CURLOPT_RETURNTRANSFER,true);
	$res= curl_exec($ch);
	curl_close($ch);
	if ($res) {
		if (preg_match('/"r":\[(.*?)\]}\)/',$res,$matches))
		{		
			$response=str_replace('"','',$matches[1]);
 
			$response2=explode(',',$response);
			$response3='';
			foreach ($response2 as $key => $value) 
			{
				$value2=urlencode($value);
				$search_url2="http://www.google.com/search?q=$value2&hl=en&tbo=1&tbs=ww:1";
 
				$ch2 = curl_init();
				curl_setopt($ch2, CURLOPT_USERAGENT, 'Opera/9.63 (Windows NT 5.1; U; fr) Presto/2.1.1');
				curl_setopt($ch2, CURLOPT_URL,$search_url2);
				curl_setopt($ch2, CURLOPT_FAILONERROR, true);
				curl_setopt($ch2, CURLOPT_REFERER, $search_url2);
				curl_setopt($ch2, CURLOPT_RETURNTRANSFER,true);
				$res2= curl_exec($ch2);
				curl_close($ch2);
				if ($res2) 
				{	
					if (preg_match('/"r":\[(.*?)\]}\)/',$res2,$matches2))
					{		
						$response.=','.str_replace('"','',$matches2[1]);
					}
				}
			}
			$response3=array_unique(explode(',',$response));
			asort($response3);
			$res_final='Mot-clé : '.urldecode($q);
			$res_final.='<br />Résultats: <br /><ul>';
			foreach ($response3 as $key => $value) 
			{
			$res_final.='<li>'.utf8_decode($value).'</li>';
			//flush();
			}
			$res_final.='</ul>';
		}
	}
 	return $res_final;
}
?>

Ce script peut être largement améliorié, c’est une base de départ ;)

Voici le résultat de l’extraction à partir du mot-clé référencement :

  • api google
  • comparatif moteur de recherche
  • demande de devis
  • devis création site internet
  • devis gratuit
  • devis referencement
  • exalead moteur de recherche
  • l api
  • la soumission
  • le positionnement
  • les moteurs
  • les moteurs de recherche
  • liens commerciaux
  • loi informatique et libertés
  • moteur de recherche altavista
  • moteurs de recherche
  • moteurs de recherche gratuits
  • mots clefs
  • méthodologie création site internet
  • page rank gratuit
  • positionnement moteur de recherche
  • principaux moteurs de recherche
  • referencement google
  • referencement gratuit
  • referencement gratuit internet
  • referencement gratuit moteur de recherche
  • referencement internet
  • referencement manuel
  • referencement moteurs de recherche
  • referencement naturel
  • referencement positionnement
  • référencement manuel
  • référencement manuel gratuit
  • référencement moteurs de recherche
  • référencement payant
  • soumission moteur de recherche
  • url rewriting

Commentaires (19)

Catégorie: Google, Scripts PHP



SEO BLACKOUT

Site web dédié aux techniques de référencement et de positionnement de sites web sur les moteurs de recherche Google, Yahoo, MSN.
Certaines parties du site sont en accès restreint, ces espaces sont réservés à la SEO Black Hat Team.


Don't Be Evil !