Détecter les sites adultes
Ecrit par admin le Jeudi 25 février 2010 à 15:11 - Catégorie Référencement
Il peut être parfois nécessaire de détecter un site adulte, cela peut être utile dans le cas où vous maintenez un annuaire par exemple ou encore dans le cas où vous utilisez LFE (link farm evolution) et que vous ne souhaitez pas poser vos liens sur des blogs à dominante adulte.
Comment détecter un site adulte ?
Il existe plusieurs solutions :
- Chercher dans le texte de la page des mots-clés adultes à l’aide d’un script et d’une liste de mots-clés adultes prédéfinis
- Analyser les pixels des images présentes sur la page et si dominante chair alors suspicion (idée proposée par Sébastien Billard)
- Analyser les pubs présentes sur la page, avec au préalable un listing des régies adultes comme Carpediem…
- Utiliser des api qui classent les sites dans des catégories comme http://bcws.brightcloud.com
Je vous propose une autre solution, simple à mettre en place qui consiste à utiliser la fonction SafeSearch de Google :
La fonction SafeSearch de Google empêche l’affichage dans les résultats de recherche des pages Web à caractère sexuel.
Il suffit donc de mettre l’option safesearch sur strict et ensuite de saisir la commande info:ndd_adulte.tld, si 0 résultats retournés, alors c’est un site adulte.
Il ne vous reste plus qu’à faire le script qui va bien…
N.B : Cet idée d’article m’est venu suite à une discussion lancée par Maxime sur la sphère : http://www.seosphere.com/forum/index.php?showtopic=10060
Il ya certaiment d’autres méthodes, les commentaires sont là pour ça
Commentaires (9)
Catégorie: Référencement
- Ajouter cet article à :
- Del.icio.us -
- Digg
Commentaire par Maxime (2 commentaires)
Jeudi, 25 février , 2010 à 15:21
Normalement, je dis bien normalement, les sites adultes sérieux sont censé placer sur leurs pages un tag ICRA facilement identifiable dans le . Pour avoir travaillé pas mal de temps dans le milieu je sais qu’énormément de sites respectent ce tag ça permet donc d’en filtrer un bon paquet assez facilement.
Commentaire par Maxime (2 commentaires)
Jeudi, 25 février , 2010 à 15:21
identifiable dans le « head » (les balises ne passent pas).
Commentaire par admin
Jeudi, 25 février , 2010 à 17:16
Merci Maxime, j’y avais pensé mais ne connaissais pas la proportion d’utilisation, du coup comme tu dis ça peut faire un premier filtre simple à mettre en place
Commentaire par Maxime
Jeudi, 25 février , 2010 à 17:44
Hé, hé, heureux de voir que mon post t’as inspiré ![]()
Je ne connaissais pas l’API, intéressant, et pas très cher.
Pour Google, ça marche, mais ça prends du temps car on peut avoir les mêmes problèmes que quand on fait de l’extraction. Ca peut prendre un peu de temps, mais sans doute plus précis que le bout de script que j’ai pondu sur un coin de table …
Commentaire par mickael44 (1 commentaire)
Jeudi, 25 février , 2010 à 18:03
Bonjour à tous !
J’ai fait vite fait un petit script pour répondre à ton idée. Il est accessible sur la Sphere : http://www.seosphere.com/forum/index.php?showtopic=10060
Bon, maintenant que j’ai posté, je file me présenter vite fait
Commentaire par Inglourious SEO (1 commentaire)
Jeudi, 25 février , 2010 à 18:37
Un soir ou j’étais bien fatigué j’ai eut une grande frayeur, une dizaine de sites black listé !!!
Grand moment de solitude, le quality rater a encore frappé…
Au bout de 30 minutes, je me rends compte que j’avais activé le filtre adulte
Commentaire par admin
Vendredi, 26 février , 2010 à 10:53
Rudy
Merci Mickael pour le script
@Maxime de la Sphère, ça ne devrait pas poser de soucis, c’est minime comme appel, tu fais le check au moment de l’inscription, me dit pas que t’as plus d’une dizaine d’inscriptions/jour ?, et si tu veux check toute ta bdd, étale dans le temps…
Commentaire par BlackMelvyn (3 commentaires)
Vendredi, 26 février , 2010 à 11:01
Pour les sites un peu respectueux des metas (il y en a encore
) on peut également checker la balise meta rating qui peut avoir comme contenu « general », « mature » (pas MILF hein
), « restricted » ou « 14years »
Mais bon, je crois qu’on n’est pas nombreux à l’utiliser…
Commentaire par Maxime
Vendredi, 26 février , 2010 à 11:33
@admin
A vrai dire je l’ai joué fainéant, j’ai parsé ma base mysql en entier. Désolé, c’est bourrin …
C’est clair qu’à l’inscription ça aurait pu passé. Je vais peut-être faire ça tient.
Filtre Google à l’inscription et vérification dans l’admin avec mon bout de code.















