Seohackers netlinking

Extraire les backlinks référencés par Alexa

Ecrit par lemoussel le mercredi 5 août 2009 à 23:07 - Catégorie Scripts PHP

Comment extraire / parser les backlinks référencés par Alexa ?
Voici un script php permettant d’extraire, du site Alexa, la liste des sites qui mentionnent votre blog/site avec un backlink (un backlink ou “lien retour” est un lien qui pointe vers votre site).

Ainsi avec ce script vous saurez rapidement qui vous cite à la réserve près que dans cette liste n’apparait que les backlinks identifiés par Alexa (par curiosité regardez pour www.seoblackout.com).

Code source du script :
Ci-dessous le code du script php à copier/coller dans un fichier et à télécharger sur votre serveur ou à utiliser en local :

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
<?php
//
// Script php : Extraction Liens Alexa
// By : lemoussel - Aout 2009
//
// Copyright Aout 2009 www.seoblackout.com 	
//
 
@set_time_limit(0);
 
if ((isset($_POST['dn'])) && ($_POST['dn']!='')) 
{
  $dn = trim(strip_tags($_POST['dn']));
  $Page = 0;
  $nextPage = true;
  $listLink = array();
 
  do 
  {
    $ch = curl_init();
 
    curl_setopt($ch, CURLOPT_URL, 'http://www.alexa.com/site/linksin;' . $Page . '/' . $dn);
    curl_setopt($ch, CURLOPT_HEADER, 1);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 5);
    curl_setopt($ch, CURLOPT_REFERER, 'http://www.alexa.com/');
    curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.8) Gecko/2009032609 Firefox/3.0.8');
 
    $result['EXE'] = curl_exec($ch);
    $result['ERR'] = curl_error($ch);
 
    curl_close($ch);
 
    if ( empty( $result['ERR'] ) )
    {
      preg_match_all('(<a rel.*style.*href="(.*)".*>)siU', $result['EXE'], $linkfind);    
      foreach($linkfind[1] as $val)
         array_push( $listLink, $val );
      preg_match("(<a class='next' rel='next' href='(.*)')siU", $result['EXE'], $nextlink);
      if ($nextlink[1]) 
        $Page++;
      else
        $nextPage = false;
    }
    else
        $nextPage = false;
  } while ($nextPage == true);
}
?>
 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Extraction Alexa "Site Linking"</title>
</head>
<body>
<h1>Extraction Alexa "Site Linking"</h1>
<div>
 
<?php 
if ((isset($_POST['dn'])) && ($_POST['dn']!='')) {
	echo '<h3>Alexa Link Results : ' . count( $listLink ) . ' links.</h3>';
	echo '<h4>Domaine : ' . $dn . '</h4>';
	for ($i = 0; $i < count( $listLink ); $i++)
     echo '<a href="' . $listLink[$i] . '">' . $listLink[$i] . '</a><br>';
}
?>
 
<form method="POST" action="<?php echo strip_tags($_SERVER['REQUEST_URI']) ;?>">
<p>Saisir le domaine  (sans les www) :</p>
<input name="dn" type="text" size="100" value="<?php if (isset($_POST['dn'])) {echo strip_tags($dn);} ?>">
<p><input type="submit" value="Go" name="go">
<input type='button' value='Annuler' onclick='location.href="<?php echo strip_tags($_SERVER['REQUEST_URI']) ;?>"'></p>
</form>
<br />
<small>Script PHP proposé par SEO BlackOut : <a href="http://www.seoblackout.com/">référencement</a></small>
</div>
</body>
</html>

Article écrit par Lemoussel
liste de proxies opérationnels
black hattitude

Articles liés :

Commentaires (9)

Catégorie: Scripts PHP


9 Commentaires

Commentaire par Julien

jeudi, 6 août , 2009 à 8:23

Tiens j’ai découvert des bl insoupçonnés pour mon blog, merci 🙂

Commentaire par Gwaradenn

jeudi, 6 août , 2009 à 8:45

Merci, je viens de découvrir des liens que je ne connaissais pas.

Inutile, car ce sont de vrais liens naturels, mais toujours sympas à étudier.

Commentaire par Olivier

jeudi, 6 août , 2009 à 10:17

Félicitation lemoussel, je viens de tester le script : il marche impeccable. J’ai juste une erreur de type NOTICE à la ligne 40 (j’ai remplacé cette ligne par if (isset($nextlink[1])) et ca règle le problème).
Je travaille également sur les pages Alexa en ce moment mais pour récupérer une autre donnée.

Commentaire par lemoussel

vendredi, 7 août , 2009 à 7:42

@Olivier
Ce type d’erreur est reporté ou pas selon la configuration du serveur. Cela n’est pas positionné sur mon serveur par défaut car c’est le type d’erreur le moins important.

Ta remarque est toutefois pertinente. Il est judicieux de positionner le rapport d’erreur de niveau E_NOTICE durant la phase de développement afin de signaler des bogues potentiels dans le code. En effet les messages E_NOTICE signalent les mauvaises pratiques de codage. Ce qui est la cas en ligne 40 !

Pour fixer le niveau de rapport d’erreurs PHP, il faut utiliser la fonction error_reporting() [http://www.php.net/manual/fr/function.error-reporting.php].
En début du code PHP il suffit donc d’ajouter la ligne suivante :
error_reporting(E_ALL | E_NOTICE);

Commentaire par MagicYoyo

vendredi, 7 août , 2009 à 8:29

Sur un test rapide, il semble qu’Alexa liste aussi les liens nofollow.

Commentaire par Alexandra

samedi, 3 octobre , 2009 à 18:13

salut,

Je viens de lire un article intéressant pour augmenter son ranking alexa
http://www.doshdosh.com/20-quick-ways-to-increase-your-alexa-rank/

Il conseille entre autre de faire des liens de ce type :
http://redirect.alexa.com/redirect?wamiz.com

Vous confirmez l’intérêt de cette astuce?

Commentaire par lemoussel

samedi, 3 octobre , 2009 à 20:52

Alexandra, de mémoire, cette astuce de redirection Alexa n’est plus opérationnel depuis le début d’année 2008.

Commentaire par Documentaires

mardi, 24 novembre , 2009 à 19:23

Quelqu’un connait une autre astuce qui serait toujours fonctionnelle et efficace en date de Novembre 2009?

Commentaire par Jerome

mardi, 14 septembre , 2010 à 12:05

Shit apparement le script ne marche plus :/
Quelqu’un peut confirmer ?

Les commentaires sont fermés pour cet article.



SEO BLACKOUT

Site web dédié aux techniques de référencement et de positionnement de sites web sur Google.

Certaines parties du site sont en accès restreint, ces espaces sont réservés à la SEO Black Hat Team.


Don't Be Evil !