5 funzioni di scansione più sottovalutate
Pubblicato: 2021-10-20Sei un Oncrawler esperto che pensa di conoscere la piattaforma come il palmo della loro mano? Oppure, hai recentemente collaborato con noi e stai cercando consigli da addetti ai lavori per darti il via? Come parte del team CSM di Oncrawl, ho una visione particolare degli strumenti della piattaforma che ho notato vengono visitati meno frequentemente. Quindi, indipendentemente dalla tua situazione, ecco un riepilogo delle mie 5 principali funzionalità sottovalutate di Oncrawl che potresti aver trascurato o che semplicemente non conosci ancora!
Campi personalizzati (raccolta dati)
Un breve riepilogo sui campi personalizzati di Oncrawl, offriamo due metodi per lo scraping, XPath e Regex. E prima di andare oltre, se hai bisogno di uno sguardo più approfondito al web scraping, all'estrazione di dati dai siti Web, dai un'occhiata a questo articolo che ne illustra le utili funzioni.
Ora le funzionalità del campo personalizzato potrebbero non essere necessariamente rivoluzionarie, ma ciò che è incredibilmente conveniente è la possibilità di utilizzare un mix di Regex e XPath piuttosto che limitarsi a un metodo.
Per dirlo semplicemente, Regex e Xpath sono metodi per trovare le cose. Invece di eseguire singole ricerche di testo, puoi eseguire una ricerca in base a uno schema. Supponiamo che tu voglia identificare il mese in questo testo, "21 settembre", invece di cercare "settembre", con Regex puoi usare \w+ per raccogliere il carattere della parola. Mentre Xpath ti consente di visualizzare elementi di testo da un documento XML o HTML. In questo caso, supponiamo che tu voglia visualizzare il contenuto all'interno dell'elemento div, inizierai con //div[@class e così via. In alcuni casi vuoi solo visualizzare il contenuto, in altri vuoi identificare uno schema specifico, ma a volte è necessario un mix di entrambi.
Ad esempio, supponiamo di voler raschiare il prezzo per tutti gli articoli del prodotto su un sito. Nella mia prima regola, sto usando XPath e puoi vedere che sto estraendo i dati grezzi per verificare che sto raccogliendo l'elemento del prezzo:
Quindi, uso Regex per la mia seconda regola per raccogliere qualsiasi elemento solo fino alle virgolette, in questo caso, il prezzo: content=”([^\”]+):
Rende la creazione di regole di scraping un po' più semplice e veloce. E se non ti senti ancora a tuo agio con nessuno dei metodi, abbiamo un bell'articolo qui con alcuni suggerimenti.
Filtri personalizzati in Esplora dati
Ti ritrovi mai in Esplora dati a cercare di ricordare i filtri che hai utilizzato con Oncrawl Query Language? O forse ogni volta che sei lì usi sempre manualmente l'OQL per filtrare le pagine scansionate e aggiungere ogni colonna pertinente una per una. Bene, potresti risparmiare tempo prezioso utilizzando la funzione di filtri personalizzati, che si trova comodamente a destra delle opzioni DataSet:
Hai l'opzione Quickfilters che è composta da query comuni e ogni filtro personalizzato che salvi verrà aggiunto nella sezione "Filtri propri" dove puoi facilmente recuperare le pagine che stai cercando. Questo può essere fatto per ogni set di dati a tua disposizione, per impostazione predefinita avrai pagine e collegamenti, ma se hai abilitato il monitoraggio dei registri nell'abbonamento vedrai l'opzione per il monitoraggio dei registri: pagine e il monitoraggio dei registri: eventi.
Tutto quello che devi fare è utilizzare l'OQL per filtrare le pagine, qui stiamo guardando le pagine SEO Active per il 18 agosto, in particolare per il gruppo di pagine Blog:
E poi puoi utilizzare il menu a discesa ("AGGIUNGI COLONNE") per aggiungere le metriche pertinenti alla tua ricerca:
Quindi fai clic su "SALVA FILTRI" per salvare il tuo filtro personalizzato e sarà disponibile in "Filtri personali"
Avvisi/notifiche del registro
Una recente aggiunta ai nostri aggiornamenti delle funzionalità per il 2021 che può essere trascurata è l'opzione per abilitare gli avvisi di registro: è un ottimo modo per essere consapevoli di eventuali problemi di elaborazione con i tuoi registri. Quindi, invece di aspettare di scoprire un problema con eventuali depositi quando accedi alla piattaforma, abilita l'avviso di registro per farti sapere quando i registri non sono stati depositati di recente o ciò che è stato depositato non è considerato utile.
È piuttosto semplice da usare, vai nel tuo progetto che ha il monitoraggio dei registri abilitato e fai clic sulla scheda "Strumenti di gestione dei registri":
Una volta che sei nel rapporto Strumenti di Log Manager, fai clic su "Configura notifiche":
Da qui potrai abilitare le notifiche e definire una soglia per quando dovresti essere contattato se non sono state depositate righe utili o nuovi file.
Questo può far risparmiare tempo nello scoprire cosa è andato storto esattamente con alcuni depositi, il che ti avvicina molto di più ad avere rapporti aggiornati prima.
[Ebook] Quattro casi d'uso per sfruttare l'analisi dei log SEO
Strumenti di gestione del registro
Dato che siamo in tema di log, sembra opportuno menzionare che il rapporto Strumenti di Log Manager è un'altra grande area della piattaforma che spesso non viene utilizzata tutte le volte che potrebbe essere. È un bel piccolo hub nascosto nel livello del progetto che è composto con i dettagli su cosa viene esattamente depositato, per quanto riguarda i file di registro.
Quando entri, non solo vedrai i file esatti che sono stati depositati, vedrai la data e l'ora esatte di ogni deposito, la suddivisione di ogni tipo di riga di registro (OK, filtrata, errata), un grafico che monitora quella quantità di falsi bot hit rilevati per data di deposito, e puoi vedere una scomposizione della qualità dei log depositati e la distribuzione delle linee utili.
È un ottimo posto per controllare la qualità dei depositi di file, ad esempio assicurandosi che i file siano compressi, se stai effettivamente depositando linee relative alla SEO, come nelle visite organiche e nei bot hit, e verificando la frequenza dei depositi.
Se inizi a notare qualcosa di strano con i tuoi rapporti di registro, un ottimo punto di partenza per l'indagine è negli strumenti di gestione del registro. Potresti scoprire che il formato della riga di log è cambiato e il nostro team Customer Success ha bisogno di aggiornare il parser, o forse noterai che il nome del bucket è cambiato e devi inviarci nuove credenziali. In ogni caso, puoi sempre dare un'occhiata e contattarci se hai bisogno di aiuto per scavare più a fondo.
Segmentazioni personalizzate
Ultimo ma non meno importante, la nostra aggiunta più recente al nostro arsenale, le segmentazioni personalizzate! Ora abbiamo una raccolta di modelli di segmentazione per ispirare i nuovi utenti di Oncrawl che non hanno mai lavorato su una segmentazione o per rendere lo sviluppo di una segmentazione un po' più agevole.
Scorri rapidamente le segmentazioni, sono essenziali per lo sviluppo poiché vuoi sapere quale parte del sito stai guardando durante l'ispezione dei risultati della scansione. Possono essere semplici come il raggruppamento di pagine in base al primo percorso nell'URL o possono essere specifici come il raggruppamento di pagine in base a un intervallo di sessioni GA.
Oltre ai modelli che ora ti danno una piccola guida sul perché dovresti usarlo, avrai anche più modelli disponibili in base ai connettori di dati esterni che hai impostato per il progetto.
Quindi, se disponi di dati di registro, avrai un suggerimento sul modello per le visite SEO o i bot hit e, se hai collegato Google Search Console, vedrai l'opzione per creare una segmentazione basata su Posizioni o Pagine di ranking.
Sta a te decidere come visualizzare il sito, siamo qui per renderlo un po' più semplice. Quindi vai avanti, provaci e dicci cosa ne pensi.