5 fonctionnalités Oncrawl les plus sous-estimées

Publié: 2021-10-20

Êtes-vous un Oncrawler chevronné qui pense connaître la plate-forme comme sa poche ? Ou, vous êtes-vous récemment associé à nous et recherchez-vous des conseils d'initiés pour vous lancer? En tant que membre de l'équipe CSM d'Oncrawl, j'ai un point de vue particulier sur les outils de la plateforme dont j'ai remarqué qu'ils sont moins visités. Donc, quelle que soit votre situation, voici un tour d'horizon de mon top 5 des fonctionnalités Oncrawl sous-estimées que vous avez peut-être négligées ou que vous ne connaissez pas encore !

Champs personnalisés (scraping de données)

Petit récapitulatif sur les champs personnalisés chez Oncrawl, nous proposons deux méthodes de scraping, XPath et Regex. Et avant d'aller plus loin, si vous avez besoin d'un examen plus approfondi du grattage Web, de l'extraction de données à partir de sites Web, consultez cet article qui passe en revue ses fonctions utiles.

Maintenant, les fonctionnalités de champ personnalisé ne sont pas nécessairement révolutionnaires, mais ce qui est incroyablement pratique, c'est la possibilité d'utiliser un mélange de Regex et de XPath plutôt que d'être limité à une seule méthode.
Pour le dire simplement, Regex et Xpath sont des méthodes pour trouver des choses. Plutôt que d'effectuer des recherches de texte individuelles, vous pouvez effectuer une recherche basée sur un modèle. Supposons que vous souhaitiez identifier le mois dans ce texte, "Septembre, 21", plutôt que de rechercher "Septembre", avec Regex, vous pouvez utiliser \w+ pour sélectionner le caractère du mot. Alors que Xpath vous permet d'afficher des éléments de texte à partir d'un document XML ou HTML. Dans ce cas, disons que vous voulez afficher le contenu dans l'élément div, vous commencerez avec //div[@class et ainsi de suite. Dans certains cas, vous souhaitez simplement afficher le contenu, dans d'autres, vous souhaitez identifier un modèle spécifique, mais parfois vous avez besoin d'un mélange des deux.

Par exemple, disons que je veux gratter le prix de tous les articles d'un site. Dans ma première règle, j'utilise XPath et vous pouvez voir que j'extrait les données brutes pour vérifier que je récupère l'élément de tarification :


Ensuite, j'utilise Regex pour ma deuxième règle pour ne sélectionner aucun élément jusqu'au guillemet, dans ce cas, le prix : content="([^\"]+) :

Cela rend la création de règles de grattage un peu plus rapide et plus facile. Et si vous n'êtes pas à l'aise avec l'une ou l'autre méthode, nous avons un bel article ici avec quelques conseils.

Filtres personnalisés dans l'explorateur de données

Vous arrive-t-il de vous retrouver dans l'explorateur de données en train d'essayer de vous souvenir des filtres que vous avez utilisés avec le langage de requête Oncrawl ? Ou peut-être que chaque fois que vous y êtes, vous utilisez toujours manuellement l'OQL pour filtrer les pages explorées et ajouter chaque colonne pertinente une par une. Eh bien, vous pourriez gagner un temps précieux en utilisant la fonction de filtres personnalisés, qui est idéalement située à droite des options DataSet :

Vous avez l'option Quickfilters qui est composée de requêtes courantes, et chaque filtre personnalisé que vous enregistrez sera ajouté dans la section "Propres filtres" où vous pourrez facilement récupérer les pages que vous recherchez. Cela peut être fait pour chaque ensemble de données à votre disposition, par défaut, vous aurez des pages et des liens, mais si vous avez activé la surveillance des journaux dans votre abonnement, vous verrez l'option pour la surveillance des journaux : pages et la surveillance des journaux : événements.

Tout ce que vous avez à faire est d'utiliser l'OQL pour filtrer les pages, ici nous regardons les pages SEO actives pour le 18 août, spécifiquement pour le groupe de pages Blog :

Ensuite, vous pouvez utiliser le menu déroulant ("AJOUTER DES COLONNES") pour ajouter les statistiques pertinentes à votre recherche :

Cliquez ensuite sur "SAVE FILTERS" pour enregistrer votre filtre personnalisé et il sera disponible sous "Propres filtres"


Journal Alerte/Notifications

Un ajout récent à nos mises à niveau de fonctionnalités pour 2021 qui peut être négligé est l'option d'activation des alertes de journal - C'est un excellent moyen d'être au courant de tout problème de traitement avec vos journaux. Ainsi, plutôt que d'attendre de découvrir un problème avec les dépôts lorsque vous vous connectez à la plate-forme, activez l'alerte de journal pour vous informer lorsque les journaux n'ont pas été déposés récemment ou que ce qui est déposé n'est pas considéré comme utile.

C'est assez simple à utiliser, dirigez-vous vers votre projet dans lequel la surveillance des journaux est activée et cliquez sur l'onglet "Outils du gestionnaire de journaux":

Une fois que vous êtes dans le rapport des outils du gestionnaire de journaux, vous cliquez sur « Configurer les notifications » :

De là, vous pourrez activer les notifications et définir un seuil à partir duquel vous devez être contacté si aucune ligne utile ou aucun nouveau fichier n'a été déposé.

Cela peut vous faire gagner du temps en découvrant exactement ce qui ne va pas avec certains dépôts, ce qui vous rapproche d'autant plus d'avoir des rapports à jour plus tôt.

[Ebook] Quatre cas d'utilisation pour tirer parti de l'analyse des journaux SEO

Découvrez comment les fichiers journaux, en tant que référence unique et fiable pour le trafic du site Web, peuvent fournir des réponses simples aux questions difficiles en matière de référencement.
Télécharger gratuitement

​​Outils du gestionnaire de journaux

Puisque nous parlons de journaux, il semble approprié de mentionner que le rapport des outils du gestionnaire de journaux est un autre grand domaine de la plate-forme qui, souvent, n'est pas utilisé aussi souvent qu'il pourrait l'être. C'est un joli petit hub niché au niveau du projet qui est composé des détails sur ce qui est exactement déposé, en ce qui concerne les fichiers journaux.

Lorsque vous vous lancez, non seulement vous verrez les fichiers exacts qui ont été déposés, mais vous verrez la date et l'heure exactes de chaque dépôt, la répartition de chaque type de ligne de journal (OK, filtrée, erronée), un graphique qui surveille la quantité de faux accès de bot détectés par date de dépôt, et vous pouvez voir une ventilation de la qualité des journaux déposés et la répartition des lignes utiles.

C'est un excellent endroit pour vérifier la qualité des dépôts de fichiers, par exemple en s'assurant que les fichiers sont compressés, si vous déposez réellement des lignes liées au référencement, comme dans les visites organiques et les visites de robots, et en vérifiant la fréquence des dépôts.

Si vous commencez à remarquer quelque chose d'étrange avec vos rapports de journal, un bon endroit pour commencer votre enquête est dans les outils du gestionnaire de journaux. Vous découvrirez peut-être que le format de la ligne de journal a changé et que notre équipe Customer Success doit mettre à jour l'analyseur, ou peut-être remarquerez-vous que le nom du compartiment a changé et que vous devez nous envoyer de nouvelles informations d'identification. Dans tous les cas, vous pouvez toujours jeter un coup d'œil et nous contacter si vous avez besoin d'aide pour creuser plus profondément.

Segmentations personnalisées

Enfin, notre plus récent ajout à notre arsenal, les segmentations personnalisées ! Nous avons maintenant une collection de modèles de segmentation pour inspirer les nouveaux utilisateurs d'Oncrawl qui n'ont jamais travaillé sur une segmentation, ou pour rendre le développement d'une segmentation un peu plus fluide.

Présentation rapide des segmentations, elles sont essentielles au développement, car vous voulez savoir quelle partie du site vous consultez lorsque vous inspectez les résultats du crawl. Ils peuvent être aussi simples que le regroupement de pages par le premier chemin dans l'URL, ou peuvent être aussi spécifiques que le regroupement de pages par une plage de sessions GA.

En plus des modèles qui vous donnent maintenant quelques indications sur la raison pour laquelle vous devriez l'utiliser, vous aurez également plusieurs modèles disponibles en fonction des connecteurs de données externes que vous avez configurés pour le projet.

Donc, si vous avez des données de journal, vous aurez une suggestion de modèle pour les visites SEO ou les hits de bot, et si vous avez connecté Google Search Console, vous verrez l'option de créer une segmentation basée sur les positions ou les pages de classement.

C'est à vous de décider comment vous souhaitez visualiser le site, nous sommes là pour vous faciliter un peu la tâche. Alors allez-y, essayez-le et dites-nous ce que vous en pensez.

Commencez votre essai gratuit de 14 jours

Découvrez par vous-même pourquoi Oncrawl est la plateforme SEO technique et data la plus reconnue du marché ! Aucune carte de crédit requise et aucune condition : seulement 14 jours d'essai complet.
Commencez votre essai