Cinq façons d'améliorer votre analyse de log SEO avec l'intégration Splunk d'OnCrawl
Publié: 2019-01-03OnCrawl a récemment publié une intégration Splunk pour faciliter la surveillance des journaux pour les utilisateurs de Splunk. Nous avons constaté que les entreprises utilisent notre intégration Splunk à deux fins principales : l'automatisation des processus et un contrôle de sécurité élevé. Mais les avantages de l'outil ne s'arrêtent pas là. Voici cinq façons d'utiliser l'intégration OnCrawl Splunk pour améliorer votre référencement technique.
Analyse des logs SEO : les bases
Qu'est-ce que l'analyse des logs SEO ?
Vos fichiers journaux représentent toutes les activités sur votre site Web enregistrées par le serveur du site Web lui-même. C'est la source d'information la plus complète et la plus fiable concernant ce qui se passe sur votre site Web. Cela inclut le nombre et la fréquence des visites de bots, le nombre et la fréquence des visites organiques SEO provenant des SERP, la répartition par type d'appareil (ordinateur de bureau contre mobile) ou par type d'URL (page contre ressource), les tailles de page précises et le statut HTTP réel. codes.
Quelques-uns des nombreux avantages offerts par l'analyse des logs SEO :
- Repérer les pics ou les changements dans le comportement d'exploration qui indiquent des modifications dans la façon dont votre site est géré par Google
- Savoir combien de temps, en moyenne, il faut pour que les nouvelles pages soient indexées et reçoivent les premiers visiteurs organiques
- Surveillance de l'impact de l'activité des bots et des utilisateurs sur le classement d'une page
- Comprendre comment le comportement des bots et des utilisateurs est en corrélation avec d'autres facteurs de référencement
Qu'est-ce que Splunk ?
Splunk est une solution d'entreprise pour l'agrégation de données machine. Capable d'indexer et de gérer des données provenant de plusieurs sources à grande échelle, il comprend des fonctions de traitement des journaux de serveur à des fins de sécurité du site et de création de rapports.
Quelques-uns des avantages de Splunk :
- Indexation et recherche d'une meilleure corrélation des données
- Capacités d'exploration et de pivotement pour de meilleurs rapports
- Alertes en temps réel
- Tableaux de bord de données
- Hautement évolutif
- Options de déploiement flexibles
Surveillance des journaux dans Splunk
Les utilisateurs de Splunk bénéficient d'une intégration OnCrawl pour connecter les données de log du serveur gérées dans Splunk avec les données SEO dans la plateforme OnCrawl.
Analyseur de journaux Oncrawl
Améliorer votre référencement technique avec OnCrawl + Splunk
1. Utilisez les journaux pour une analyse SEO approfondie
Splunk prouve sa capacité à agréger, rechercher, surveiller et configurer des alertes pour les données de journal. Il analyse et réindexe le contenu des journaux du serveur. À l'aide d'une recherche et de filtres puissants, il fournit des réponses aux questions sur les données de vos fichiers journaux. Cette étape de traitement fournit des statistiques sur les tendances révélées dans les données de journal.
Cependant, lorsque vous souhaitez appliquer cela aux données SEO, il est préférable de commencer par les données brutes. Et c'est exactement ce que fait l'intégration OnCrawl Splunk.
Au lieu de simplement afficher des statistiques séparées pour les données de logs, cela vous permet d'intégrer les informations des logs avec toutes les autres sources de données de la plateforme OnCrawl. À son tour, cela vous permet d'examiner les relations entre les métriques SEO et les informations sur le comportement des utilisateurs et des bots dans vos fichiers journaux.
Nombre de visites organiques par profondeur de clic de page.
Cette analyse croisée des données peut inclure des axes utiles au SEO :
- Répartition du comportement de crawl par bots individuels
- Temps entre le premier crawl et la première visite organique
- Comparaison entre les pages servies aux utilisateurs et aux bots, et les pages servies lors d'un crawl d'audit
- Découverte de pages orphelines
- Corrélations entre la fréquence de crawl et le classement, les impressions, le CTR
- Influence de la stratégie de maillage interne sur l'activité des utilisateurs/bots
- Relation entre la profondeur des clics sur la page et l'activité de l'utilisateur/bot
- Relation entre la popularité de la page interne et l'activité des utilisateurs/bots
- Répartition de l'activité des utilisateurs et des bots sur les pages regroupées par performances SEO
2. Facilitez la configuration
Que vous ayez besoin ou non d'automatisation ou de contrôles plus précis pour la sécurité des données, si vous êtes un utilisateur de Splunk, vous
comme la simplicité de mise en place.

Si vous n'êtes pas un administrateur système, la configuration de la surveillance des journaux pour le référencement peut sembler une tâche compliquée.
Notre suggestion est de sauter simplement les parties difficiles . Vous pouvez maintenant tout configurer directement dans Splunk et utiliser la clé que vous générez pour créer la connexion avec OnCrawl.
C'est ça. Vous êtes prêt à partir. Cela ne pourrait pas être plus facile.
3. Tirez parti de l'automatisation des processus avec Splunk
Le processus manuel d'utilisation des données de journal collectées dans Splunk nécessite plusieurs étapes :
- Créer des filtres pour rechercher la bonne sélection de données de journal
- Créer une recherche enregistrée
- Configurer l'automatisation pour exécuter la recherche
- Sortie vers CSV
- Connectez-vous à votre instance Splunk en SSH
- Accédez au dossier de sortie CSV
- Transférez le fichier sur votre ordinateur
- Connectez-vous à l'espace ftp OnCrawl
- Transférez le fichier sur OnCrawl…
Ce processus doit être répété régulièrement pour éviter les lacunes dans vos données de journal. Cela devient souvent une tâche quotidienne.
Si vous choisissez d'utiliser l'intégration Splunk pour OnCrawl, vous n'avez plus besoin de lancer la tâche régulièrement . Il vous suffit de configurer le processus (et, comme mentionné précédemment, cela ne pourrait pas être plus simple). Vous n'avez plus à vous soucier du lancement quotidien d'un script ou, pire, d'une série d'actions manuelles ; l'intégration s'en charge pour vous.
4. Protégez votre processus
Protégez-vous contre la perte de données en cas de problème. Étant donné que la surveillance des journaux repose sur un flux continu de données , les lacunes peuvent conduire à des conclusions erronées. Vous ne devriez jamais avoir à vous poser des questions telles que : l'absence apparente de visites organiques ce matin est-elle due à quelque chose qui s'est passé sur Google, ou est-ce que je manque simplement les données ?
L'intégration OnCrawl Splunk vous protège en cas de panne de votre serveur ou de perte de connexion, et évite les erreurs humaines lorsque vous n'avez pas le temps ou que vous oubliez tout simplement de télécharger des données. Si nous ne pouvons pas nous connecter au serveur, cela n'entraînera pas de lacunes dans vos données ; nous allons juste le récupérer un peu plus tard. Si vous trouvez un ensemble de données d'une date antérieure que vous avez oublié d'ajouter à Splunk, l'intégration OnCrawl le récupérera également automatiquement.
5. Prenez le contrôle de la sécurité des données
Chez OnCrawl, nous prenons la sécurité de vos données très au sérieux.
Comme toujours, les données sensibles de vos journaux sont conservées là où vous les placez dans votre espace FTP privé et sécurisé et ne sont jamais mises à disposition ailleurs. Par exemple, les seules données personnelles que nous traitons sont les adresses IP lors de la validation de l'authenticité des visites de Googlebot. Nous ne conservons aucune trace des adresses IP utilisées, uniquement le résultat de la validation. Si nécessaire, vous pouvez supprimer à tout moment les informations sensibles mises à disposition pour analyse en supprimant des fichiers de votre espace FTP.
L'intégration pour Splunk va encore plus loin. Nous veillons à ce que vous gardiez le contrôle de vos données tout au long du processus. Vous définissez les droits d'accès, les données à partager et la fréquence des mises à jour dans OnCrawl. Lorsque vous partagez des données avec OnCrawl via l'intégration Splunk, nous utilisons des protocoles standard et sécurisés pour communiquer avec Splunk, protégés par un mot de passe et une clé que vous configurez.
Parce que la configuration se fait dans Splunk, OnCrawl ne voit jamais ce que vous ne nous autorisez pas à voir. Vous choisissez les informations que vous partagez avec OnCrawl . De plus, puisque vous gérez la configuration, s'il y a des changements dans votre processus de journalisation ou dans les normes de votre entreprise, vous pouvez apporter des modifications à tout moment.