Formation référencement

Eviter le duplicate content dans vos annuaires

Ecrit par admin le vendredi 28 septembre 2007 à 1:43 - Catégorie Outils référencement,Scripts PHP

Comment éviter le duplicate content (contenu dupliqué) dans vos annuaires et autres sites de soumissions d’articles ?

Forcer les webmasters à saisir une description unique lors de la soumission de leur site dans votre annuaire pour éviter le risque de duplicate content (par exemple sur les fiches individuelles des sites inscrits dans vos annuaires).

Comment forcer les webmasters à saisir une description unique ?

En vérifiant sur Google que la description du site soumis dans l’annuaire n’est pas déjà présente plus de 10 fois dans les résultats de Google (modifier ce nombre à votre convenance).

Bien sûr, on peut utiliser d’autres moteurs, voir même des sites comme Copyscape pour contrôler la description en modifiant légèrement le script proposé.

Le script PHP à télécharger ci-dessous, permet donc de contrôler la description d’un site soumis dans votre annuaire et d’afficher un message d’alerte en cas de risque de duplicate content, vous devez adapter ce script à vos annuaires.


Cliquer ici pour télécharger le script d’exemple

Voici le code du script :

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
<?php
function anti_duplicate($desc) {
//Nombre de caractères max. de la description à controler (ici 100 si plus de 100 coupe apres mot)
    $desc_cut=wordwrap(stripslashes($desc),100,"<br />",1);
    $cut = explode('<br />', $desc_cut);
    $cut = $cut[0] ;
 
    $url = 'http://www.google.fr/search?hl=fr&q="'. urlencode($cut).'"&filter=0';
    if (function_exists('curl_init')) {
            $ch = curl_init();
            curl_setopt($ch, CURLOPT_URL,$url);
            curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
            $data=curl_exec ($ch);
            curl_close ($ch);
    } 
    else {
        $data= file_get_contents($url);
    }
    $page = $data ;
    $result = explode('environ ', $page);
    $result1 = $result[1] ;
    $result2 = explode('pour', $result1);
    $result3 = $result2[0] ;
    $result3 = trim(strip_tags(str_replace('&nbsp;', '', $result3)));
 
//Ici si le nombre de résultats trouvés est supérieur à 10 alors risque de duplicate
//Vous pouvez modifier ce nombre à votre convenance
    if ($result3>10) {
        $result4 = $result3." résultats pour cette description : <i>".$cut."</i> sur Google<br>";
        $result4 .= "il y donc un risque potentiel de duplicate content, veuillez saisir une description unique !";
    }
    else {
    //echo "description ok";
    }
 
    return $result4;
}
 
//Remplacer texte par variable post de la description reçue lors de la soumission dans l'annuaire.
//A adapter selon vos annuaires
$description = "Site web dédié aux techniques de référencement et de positionnement de sites web";
//application fonction et affichage d'un message d'erreur, là encore à adapter à vos annuaires
$result_final=anti_duplicate($description);
echo $result_final;
 
?>

La fonction est commentée, elle est assez simple, à comprendre, à adapter à vos annuaires, si vous avez des questions, des commentaires, vous pouvez utiliser le formulaire au pied de cet article.

Pour ceux qui ne savent pas ce qu’est le duplicate content, faites une recherche sur google sur ce terme « duplicate content ».

Articles liés :

Commentaires (5)

Catégorie: Outils référencement,Scripts PHP


5 Commentaires

Commentaire par Crazy

vendredi, 28 septembre , 2007 à 16:31

Hello !
Ben si tu veux jouer un peu, tu peux essayer de trouver du duplicate sur ce site : http://annuaire.cigiema.fr/
Je ne pense pas que cette procédure soit utile… Pour celui-ci.
😉
Crazy

PS : Si jamais tu en trouve (qui ne soit pas en 404), il serait sympa de me le signaler de toute urgence.
Merci.

Commentaire par admin

vendredi, 28 septembre , 2007 à 20:25

Y a forcément du duplicate content Crazy 😉 suffit que je prenne par exemple mon site Net Developpeur qui est inscrit dans ton annuaire, que je prenne sa description et que je la colle dans Google pour voir que la page site sur netdeveloppeur de ton annuaire ne sort pas sur cette requête / description.

Commentaire par Gwaradenn

jeudi, 20 décembre , 2007 à 17:48

Merci à toi !
Encore quelque chose qui va être utile à mes annuaires, tout comme la faille de la dernière fois.

Commentaire par Gros

vendredi, 3 avril , 2009 à 23:52

Interressant comme toujours tes articles et c’est avec plaisir que je reviens sur ton site. J’attend des articles croustillants parce que ça fait pas mal de temps que j’en ai pas vu de nouveau (y a que ceux qui travaillent pas, qui ne savent pas pourquoi ;-)). Bravo et j’attend la suite….

Commentaire par marcelpierre

mardi, 16 février , 2010 à 1:20

on ne pourra jamais faire en sorte que malheuresement on puisse de temps à autre avoir des descriptions identique,c’est à nous donc de veiller à que ce soit au mieux..perso je les fais manuel et à l’oldschool…:)

Les commentaires sont fermés pour cet article.



SEO BLACKOUT

Site web dédié aux techniques de référencement et de positionnement de sites web sur Google.

Certaines parties du site sont en accès restreint, ces espaces sont réservés à la SEO Black Hat Team.


Don't Be Evil !