Pourquoi les référenceurs devraient abandonner Excel et apprendre SQL

Publié: 2019-10-10

La plupart de l'industrie du référencement utilise Excel pour analyser les données, ce qui n'est pas le meilleur outil à notre disposition.

En tant que référenceurs, la quantité de données auxquelles nous sommes exposés augmente rapidement chaque année. Cependant, Excel n'est pas génial avec le Big Data et vous êtes limité à un peu plus d'un million de lignes par classeur.

De plus, la façon dont les données sont traitées dans les feuilles de calcul rend les analyses SEO lentes et lourdes. Les analyses affectent les données elles-mêmes et sont difficiles à effectuer, à répéter et à partager.

Et c'est pourquoi je recommande à tous les référenceurs, en particulier en interne, de choisir SQL (et aussi Python).

Quelles sont les limites d'Excel

Si vous avez déjà utilisé une feuille de calcul, vous savez :

  • Il est facile de modifier accidentellement quelque chose qui casse vos données.
  • Il est difficile de reproduire une ancienne analyse sur de nouvelles données.
  • C'est lent lorsque les ensembles de données contiennent plus de quelques centaines de milliers de lignes.
  • Il est fastidieux de partager des feuilles de calcul géantes avec d'autres personnes.

Pourquoi passer d'Excel à SQL ?

Si vous passez à SQL à partir d'Excel, tous les problèmes que j'ai mentionnés ci-dessus disparaissent. Et vous bénéficiez de quelques avantages supplémentaires :

  1. SQL est plus rapide qu'Excel. Ce qui prend quelques heures dans Excel peut être complété en quelques minutes dans SQL.
  2. SQL sépare l'analyse des données. Lorsque vous utilisez SQL, les données que vous analysez sont stockées séparément. Cela signifie que vous pouvez envoyer à vos collègues un petit fichier de code pour accéder à votre analyse. Ils peuvent relancer l'analyse sans ruiner vos données. Et tout votre code est réutilisable.

Qu'est-ce que SQL ?

SQL est le langage standard utilisé pour extraire et analyser les données stockées dans les bases de données.

Voici un exemple de syntaxe SQL :

Vous pouvez comprendre cette syntaxe SQL sans même connaître le langage :

  1. Sélectionne toutes les colonnes
  2. A partir d'une table (source de données)
  3. Où une colonne est égale à "une valeur"

C'est la même chose que d'ajouter un filtre dans Excel.

Pourquoi les référenceurs devraient apprendre SQL

SQL ouvre la porte à la capacité de gérer plus de données. Les référenceurs, et en particulier les référenceurs techniques, trouvent une valeur croissante dans les énormes ensembles de données et dans la combinaison de grands ensembles de données. Par exemple, si vous pensez aux fichiers journaux, aux données d'exploration et à d'autres ensembles de données techniques, ils dépassent tous la limite d'Excel.

Et pour gérer ces données, nous devrions utiliser un outil conçu pour analyser les données à grande échelle. L'analyse des données à grande échelle est un domaine dans lequel SQL excelle.

Tout comme Excel, SQL peut embrouiller un ensemble de données pour créer de nouvelles colonnes à l'aide de fonctions d'agrégation ou de conditions qui facilitent la consommation des données. Cependant, il utilise une logique plus proche de la programmation, ce qui en fait également une bonne introduction au côté technique des choses pour les référenceurs intéressés à améliorer leurs compétences techniques.

Applications pratiques de SQL pour les référenceurs techniques

Maintenant, je vais partager quelques exemples où SQL fonctionne mieux qu'Excel pour l'analyse des données SEO.

Avant de commencer, rappelez-vous que pour utiliser SQL pour analyser les données, vous devez disposer de données stockées dans une base de données. Ce n'est pas un guide sur la façon d'y parvenir, mais voici quelques conseils :

  • Contactez votre équipe de données et voyez ce qu'elle a déjà dans l'entrepôt de données.
  • Ou faites-le vous-même en suivant ce guide sur Moz : « comment utiliser les grosses requêtes pour le référencement à grande échelle ».

Analyse du fichier journal

Les fichiers journaux sont un cas de mégadonnées. Les fichiers journaux dépassent facilement 1 million de lignes, vous ne pourrez donc pas analyser les données dans Excel sans échantillonnage. Et l'échantillonnage peut introduire des biais ou des erreurs.

Cependant, si vous avez les données dans une base de données (telle que Big Query), vous pouvez les analyser avec SQL.

Voici quelques questions courantes auxquelles nous pouvons répondre facilement avec SQL :

  • À quelle fréquence Googlebot visite-t-il mon site Web ?
  • Quel user-agent Googlebot explore mon site ?
  • Quel pourcentage d'accès aux requêtes renvoie une réponse autre que 200 ?
  • Quel est le % de requêtes pour chaque annuaire ou section du site ?

Sur mon blog, j'ai couvert en détail l'analyse des fichiers journaux et si vous souhaitez la configurer dans une base de données, consultez ce guide de Distilled sur l'analyse des fichiers journaux en grande requête.

Analyse des données de crawl

Si vous explorez de grands sites Web, ils dépasseront également facilement la limite d'un million de lignes d'Excel par classeur.

Même les sites Web qui n'ont théoriquement que quelques milliers d'URL peuvent atteindre des millions en raison d'une mauvaise implémentation, de l'utilisation de paramètres, des données héritées des migrations et de nombreuses autres raisons.

SQL vous permet d'analyser l'ensemble de données complet à partir d'un logiciel d'exploration, tel que OnCrawl, sans échantillonner les données. Cela signifie que vous pouvez utiliser les produits à leur plein potentiel sans avoir à vous soucier de la façon dont vous les analyserez dans Excel.

[Étude de cas] Gérer plusieurs audits de sites

En quelques semaines, l'utilisation d'OnCrawl a permis à Evergreen Media d'obtenir des gains rapides en matière de SEO concernant les Featured Snippets de Google, l'optimisation des snippets, l'amélioration des classements pour la conversion des pages, les erreurs 404... Découvrez comment OnCrawl peut faciliter le workflow de toute agence SEO en matière d'audits SEO .
Lire l'étude de cas

Analyse Google Analytics

Si vous avez déjà travaillé avec un site recevant plus de 5 visites par mois, vous avez probablement trouvé Google Analytics très lent.

L'utilisation de SQL pour analyser les données peut accélérer les choses, vous n'avez donc pas à naviguer lentement dans l'interface utilisateur en attendant longtemps que les données se chargent.

Et comme avec d'autres sources de données, SQL vous permet d'analyser vos données Google Analytics sans échantillonnage et peut vous faire économiser 250 000 $ sur la mise à niveau vers Premium.

Analyse de la console de recherche

Les données dans l'interface de Google Search Console sont excellentes, mais pour filtrer/personnaliser les données, vous n'avez pas beaucoup d'options. Il vous limite également aux 1000 premières lignes de données.

Il est préférable d'exporter les données dans Excel, mais pourquoi ne pas aller plus loin et les analyser avec SQL !

Un syllabus pour les référenceurs pour apprendre SQL

SQL pour l'analyse de données SEO n'est pas compliqué. C'est beaucoup plus facile qu'Excel à prendre en main.

À des fins de référencement, vous devez vous concentrer sur l'apprentissage de l'utilisation des fonctions suivantes :

  • SÉLECTIONNER et DE
  • commentaires
  • LIMITE
  • Opérateurs de comparaison
  • Opérateurs logiques
  • COMMANDÉ PAR
  • PAR GROUPE
  • Fonctions d'agrégation
  • CAS
  • REJOINDRE

Tout d'abord, je vous recommande de suivre le cours SQL for Data Analysis sur Udacity.

Passez ensuite au didacticiel Mode Analytics SQL. Vous pouvez appliquer vos connaissances du cours Udacity aux ensembles de données de leur entrepôt de données public.

Enfin, vous pouvez continuer à vous entraîner en suivant un cours sur Codecademy ou Datacamp.

Chacune de ces plateformes présente des défis pratiques que vous pouvez utiliser et ajouter à votre portefeuille.

Ressources utiles :

  • Écoles W3
  • Guide de style SQL
  • Éducba

La ligne du bas

Si vous voulez garder une longueur d'avance en tant que SEO, il est temps de commencer à perfectionner vos compétences en matière de données avec des outils comme SQL et Python.

SQL est un excellent point d'entrée, il est facile à comprendre et vous donnera une bonne introduction au codage. Une fois que vous avez verrouillé SQL, vous pouvez commencer à apprendre Python.