SMX West 2011 : la police anti-spam
Publié: 2011-03-11OMG, c'est emballé ici. Matt Cutts, responsable de l'équipe Webspam de Google, fait partie de ce panel. La description de SMX indique que dans cette session, certains des meilleurs "flics anti-spam" expliquent comment ils découvrent de nouvelles tactiques de spam, que faire si votre site est pénalisé par inadvertance et plus encore.
![]() |
Modérateur : Danny Sullivan, rédacteur en chef, Search Engine Land
Haut-parleurs:
Matt Cutts, ingénieur logiciel, Google Inc.
Sasi Parthasarathy, gestionnaire de programme, Bing, Microsoft
Rich Skrenta, PDG, Blekko
Danny dit qu'il y a quelques objectifs pour cette session. Tout d'abord, comprenez le vrai sens du spam. Si vous demandez si ce que vous faites est du spam Google, il y a de fortes chances que vous ne spammiez pas Google. [Tout le monde rit.]
L'autre objectif est de ne rien faire de répétitif sur les haut-parleurs. Google a un peu plus de temps que les autres panélistes et Danny dit que ce n'est pas parce qu'il aime davantage Google.
Le premier est Sasi Parthasarathy .
Qu'est-ce que le spam ? Une ou plusieurs techniques de spam pour gonfler le classement dans les moteurs de recherche d'une manière qui n'ajoute aucune valeur à l'utilisateur :
- Il y a du spam au niveau de la page et au niveau du lien.
- Texte caché.
- Liens cachés.
- Contenu généré par la machine.
- Rediriger les spams/cloaking.
- Sites piratés. La plupart des sites sont piratés pour vendre du contenu ou des produits pour adultes (indice, indice).
- Scarware.
- Reliez les fermes. Des pages de peu de contenu utile mais elles sont toutes liées les unes aux autres. Les échanges de liens sont acceptables si deux sites sont liés. Les liens non liés seront réduits si cela est découvert.
[Wow, il va très vite. J'espère que Lisa Barone comprendra tout cela, parce que je ne le suis certainement pas.]
Danny dit que Matt Cutts est très fatigué parce qu'il a travaillé toute la nuit. Il est le suivant. Il est étonnamment chipper pour être fatigué.
Exemples de spam :
- Il montre une diapositive d'un site Web. Il y a du texte caché avec des trucs qui disent "salles de bains modernes" et autres. Il n'y a rien de mal à le dire simplement sur la page. Si les salles de bains sont modernes, dites-le. [Craquer.]
- Il montre une autre diapositive avec un site bourré de mots clés avec toutes les différentes façons de mal orthographier les choses.
- Contenu généré par la machine. Risque élevé.
- Demandes d'échange de liens. Matt dit qu'il les obtient toujours et compare cela à quelqu'un qui s'approche d'un flic et demande où vous pouvez obtenir de la bonne drogue. Il montre un e-mail de quelqu'un qui a un site avec un PageRank 0, il dit qu'il imagine que ça va rester comme ça [Encore une fois, tout le monde rit].
- Les liens payants sont généralement refusés et sont associés à un contenu de mauvaise qualité. Il lit le contenu de très mauvaise qualité sur ce seul site. Lorsque vous payez 1 $ par article de blog, c'est ce que vous obtenez, dit-il. Les liens approuvés sont donnés librement. Il a dit que quelqu'un a récemment dit de faire quelque chose de si génial que les gens veulent y faire un lien.
- Sites piratés. Google a vraiment essayé de travailler là-dessus en 2010. Cela peut arriver à n'importe qui, Al Gore s'est fait pirater son site. Soyez conscient de la façon dont votre création de liens se déroule.
Mise à jour Panda : les commentaires des utilisateurs ont été extrêmement positifs. Il montre une diapositive qui l'a fait rire (ci-dessous). A 11 heures, Google a annoncé qu'il commençait à donner accès à tout le monde pour bannir certains résultats en direct du Web.

Équipe anti-spam Web
- Les ingénieurs écrivent des algorithmes.
- Les mises à jour manuelles sont proactives et réactives (la réactive prend les rapports de spam et si elle a quatre fois plus de poids, elle peut être examinée).
- La demande la plus courante adressée à Google consiste à informer les utilisateurs lorsqu'ils ont été pénalisés. Il dit qu'ils envoient maintenant des messages de "domaine parqué". Inscrivez-vous dans Google Webmaster Central pour recevoir des messages.
- Demande de réexamen : si votre site n'est affecté que par un algorithme, celui-ci est automatiquement fermé. Cela dit, les ingénieurs peuvent parcourir la file d'attente et voir quels sites sont affectés par Panda, par exemple, puis rechercher des moyens d'améliorer l'algo. S'il s'agit d'autre chose, le traitement peut prendre environ une semaine.
Rich Skrenta est debout.
Hier, Blekko a bloqué 1,1 million de sites de son moteur de recherche. Qu'est-ce que le spam ? Blekko a une définition plus large :
- Qualité du contenu. Il y a certaines choses qui ne devraient tout simplement pas figurer dans l'index. Il montre un message qui utilise des mots-clés pour un médicament qui pourrait être très dangereux pour les lecteurs. Blekko examine de près le contenu.
- Disqualifié : rémunérations, non-experts (rédaction de contenu médical, par exemple), travail d'atelier clandestin, trop lent, promotion trop agressive, mauvaise conduite.
- Blekko a le droit de refuser le service à quiconque. Ils essaient de nettoyer le Web.
[Eh bien, c'était rapide. Mais, bons morceaux.]
Des questions
Q : Rich, quels sont les défis à relever pour dire que vous devez vous débarrasser de choses qui ne sont pas écrites par des experts ? Les journalistes ne sont pas des experts, donc cela ne semble pas être une bonne définition. On dirait que les critères devraient être juste un contenu substantiel.
A: Une poignée d'exceptions. Les journalistes étudient leur métier et il y a un code qu'ils respectent. Vous pouvez faire une liste de toutes les meilleures publications. Il n'y en a qu'une poignée.
Q : Matt, pourquoi avez-vous eu besoin du New York Times et du Wall Street Journal pour vous parler des liens payants de JC Penney et Overstock ?
A: Avec Overstock, il était apparu plusieurs fois sur notre radar. Nous leur avons demandé de prendre des mesures correctives.
Q : Recommandez-vous aux grandes marques de faire appel à des sociétés de référencement ?
R : Matt dit qu'il vous recommande de faire des choses géniales vers lesquelles les gens veulent créer des liens.
Une discussion s'engage.
Rich vient de demander si tous vos efforts de référencement tombaient demain, les gens viendraient-ils toujours sur votre site ? Mais ensuite, Danny dit que si votre trafic de recherche disparaissait, personne ne verrait votre site. Rich dit que cela dépend du site.
Rich parle maintenant de la façon dont il a parlé à la moitié des personnes qui ont été bloquées sur son moteur de recherche. Il leur dit que leur site est bloqué parce que les gens le détestent, alors arrêtez de faire des sites nuls.
Q : Matt, avez-vous une liste blanche ?
R : Lorsque vous avez un algorithme, vous faites de votre mieux pour vous assurer qu'il fonctionne. Il n'y a pas de « liste d'or » de sites qui sont toujours OK. Il existe de nombreux algorithmes qui n'ont pas d'exceptions manuelles, comme la mise à jour Panda.
Q : Matt, dans les outils pour les webmasters de Google, vous envoyez des avis de pénalité. Pourquoi ne le dis-tu pas à certaines personnes ?
R : Vous voulez aider les personnes qui ont un peu dévié du chemin et non le pirate informatique. Vous voulez donner l'information aux gentils et essayez toujours de trouver l'équilibre.