Seohackers netlinking

Détecter les sites adultes

Ecrit par admin le jeudi 25 février 2010 à 15:11 - Catégorie Référencement

Il peut être parfois nécessaire de détecter un site adulte, cela peut être utile dans le cas où vous maintenez un annuaire par exemple ou encore dans le cas où vous utilisez LFE (link farm evolution) et que vous ne souhaitez pas poser vos liens sur des blogs à dominante adulte.

Comment détecter un site adulte ?

Il existe plusieurs solutions :

  • Chercher dans le texte de la page des mots-clés adultes à l’aide d’un script et d’une liste de mots-clés adultes prédéfinis
  • Analyser les pixels des images présentes sur la page et si dominante chair alors suspicion (idée proposée par Sébastien Billard)
  • Analyser les pubs présentes sur la page, avec au préalable un listing des régies adultes comme Carpediem…
  • Utiliser des api qui classent les sites dans des catégories comme http://bcws.brightcloud.com

Je vous propose une autre solution, simple à mettre en place qui consiste à utiliser la fonction SafeSearch de Google :

La fonction SafeSearch de Google empêche l’affichage dans les résultats de recherche des pages Web à caractère sexuel.

Il suffit donc de mettre l’option safesearch sur strict et ensuite de saisir la commande info:ndd_adulte.tld, si 0 résultats retournés, alors c’est un site adulte.

Il ne vous reste plus qu’à faire le script qui va bien…

N.B : Cet idée d’article m’est venu suite à une discussion lancée par Maxime sur la sphère : http://www.seosphere.com/forum/index.php?showtopic=10060

Il ya certaiment d’autres méthodes, les commentaires sont là pour ça 😉

Commentaires (10)

Catégorie: Référencement


10 Commentaires

Commentaire par Maxime

jeudi, 25 février , 2010 à 15:21

Normalement, je dis bien normalement, les sites adultes sérieux sont censé placer sur leurs pages un tag ICRA facilement identifiable dans le . Pour avoir travaillé pas mal de temps dans le milieu je sais qu’énormément de sites respectent ce tag ça permet donc d’en filtrer un bon paquet assez facilement.

Commentaire par Maxime

jeudi, 25 février , 2010 à 15:21

identifiable dans le « head » (les balises ne passent pas).

Commentaire par admin

jeudi, 25 février , 2010 à 17:16

Merci Maxime, j’y avais pensé mais ne connaissais pas la proportion d’utilisation, du coup comme tu dis ça peut faire un premier filtre simple à mettre en place 🙂

Commentaire par Maxime

jeudi, 25 février , 2010 à 17:44

Hé, hé, heureux de voir que mon post t’as inspiré 😉
Je ne connaissais pas l’API, intéressant, et pas très cher.

Pour Google, ça marche, mais ça prends du temps car on peut avoir les mêmes problèmes que quand on fait de l’extraction. Ca peut prendre un peu de temps, mais sans doute plus précis que le bout de script que j’ai pondu sur un coin de table …

Commentaire par mickael44

jeudi, 25 février , 2010 à 18:03

Bonjour à tous !

J’ai fait vite fait un petit script pour répondre à ton idée. Il est accessible sur la Sphere : http://www.seosphere.com/forum/index.php?showtopic=10060

Bon, maintenant que j’ai posté, je file me présenter vite fait 😛

Commentaire par Inglourious SEO

jeudi, 25 février , 2010 à 18:37

Un soir ou j’étais bien fatigué j’ai eut une grande frayeur, une dizaine de sites black listé !!!

Grand moment de solitude, le quality rater a encore frappé…

Au bout de 30 minutes, je me rends compte que j’avais activé le filtre adulte 😀

Commentaire par admin

vendredi, 26 février , 2010 à 10:53

😆 Rudy

Merci Mickael pour le script 🙂

@Maxime de la Sphère, ça ne devrait pas poser de soucis, c’est minime comme appel, tu fais le check au moment de l’inscription, me dit pas que t’as plus d’une dizaine d’inscriptions/jour ?, et si tu veux check toute ta bdd, étale dans le temps…

Commentaire par BlackMelvyn

vendredi, 26 février , 2010 à 11:01

Pour les sites un peu respectueux des metas (il y en a encore 😆 ) on peut également checker la balise meta rating qui peut avoir comme contenu « general », « mature » (pas MILF hein 😛 ), « restricted » ou « 14years »

Mais bon, je crois qu’on n’est pas nombreux à l’utiliser…

Commentaire par Maxime

vendredi, 26 février , 2010 à 11:33

@admin
A vrai dire je l’ai joué fainéant, j’ai parsé ma base mysql en entier. Désolé, c’est bourrin …
C’est clair qu’à l’inscription ça aurait pu passé. Je vais peut-être faire ça tient.
Filtre Google à l’inscription et vérification dans l’admin avec mon bout de code.

Commentaire par ParseError

mardi, 1 mars , 2011 à 15:31

Bonjour,
Votre idée de repérage des dominantes de couleur m’a inspiré, j’ai fait un petit script PHP que vous pouvez trouver ici !

En espérant que cela puisse être utile à certains !

Les commentaires sont fermés pour cet article.



SEO BLACKOUT

Site web dédié aux techniques de référencement et de positionnement de sites web sur Google.

Certaines parties du site sont en accès restreint, ces espaces sont réservés à la SEO Black Hat Team.


Don't Be Evil !