5 najbardziej niedocenianych funkcji Oncrawl

Opublikowany: 2021-10-20

Czy jesteś doświadczonym Oncrawlerem, który myśli, że zna platformę jak własną kieszeń? A może niedawno współpracowałeś z nami i szukasz wskazówek, które pomogą Ci rozpocząć? Jako członek zespołu CSM w Oncrawl mam szczególny pogląd na narzędzia platformy, które zauważyłem, że są rzadziej odwiedzane. Więc niezależnie od Twojej sytuacji, oto podsumowanie moich 5 niedocenianych funkcji Oncrawl, które być może przeoczyłeś lub po prostu jeszcze nie wiesz!

Pola niestandardowe (skrobanie danych)

Krótkie podsumowanie niestandardowych pól w Oncrawl, oferujemy dwie metody skrobania, XPath i Regex. A zanim przejdziesz dalej, jeśli potrzebujesz głębszego przyjrzenia się web scrapingowi, ekstrakcji danych ze stron internetowych, zapoznaj się z tym artykułem, który omawia jego przydatne funkcje.

Teraz niestandardowe funkcje pól niekoniecznie muszą być przełomowe, ale niezwykle wygodna jest możliwość korzystania z kombinacji Regex i XPath, zamiast ograniczania się do jednej metody.
Mówiąc wprost, Regex i Xpath to metody znajdowania rzeczy. Zamiast wykonywać pojedyncze wyszukiwania tekstu, możesz przeprowadzić wyszukiwanie na podstawie wzorca. Załóżmy, że chcesz zidentyfikować miesiąc w tym tekście, „21 września”, zamiast szukać „września”, za pomocą Regex możesz użyć \w+, aby wybrać znak słowa. Podczas gdy XPath umożliwia wyświetlanie elementów tekstowych z dokumentu XML lub HTML. W tym przypadku, powiedzmy, że chcesz wyświetlić zawartość w elemencie div, zaczniesz od //div[@class i tak dalej. W niektórych przypadkach chcesz po prostu wyświetlić treść, w innych chcesz zidentyfikować określony wzorzec, ale czasami potrzebujesz kombinacji obu.

Załóżmy na przykład, że chcę sprawdzić cenę wszystkich produktów w witrynie. W mojej pierwszej regule używam XPath i widać, że pobieram surowe dane, aby sprawdzić, czy wybieram element wyceny:


Następnie używam Regex do mojej drugiej reguły, aby pobierać tylko dowolny element aż do cudzysłowu, w tym przypadku wycenę: content=”([^\”]+):

To sprawia, że ​​tworzenie reguł skrobania jest trochę szybsze i łatwiejsze. A jeśli nie czujesz się komfortowo z którąkolwiek metodą, mamy tutaj fajny artykuł z kilkoma wskazówkami.

Filtry niestandardowe w Eksploratorze danych

Czy kiedykolwiek zdarzyło Ci się, że w Eksploratorze danych próbujesz zapamiętać filtry używane z językiem zapytań Oncrawl? A może za każdym razem, gdy tam jesteś, zawsze ręcznie używasz OQL do filtrowania zindeksowanych stron i dodawania każdej odpowiedniej kolumny jedna po drugiej. Cóż, możesz zaoszczędzić trochę cennego czasu, korzystając z funkcji niestandardowych filtrów, która jest dogodnie zlokalizowana po prawej stronie opcji DataSet:

Masz opcję Szybkie filtry, która składa się z typowych zapytań, a każdy zapisany filtr niestandardowy zostanie dodany w sekcji „Własne filtry”, gdzie możesz łatwo pobrać strony, których szukasz. Można to zrobić dla każdego dostępnego zestawu danych, domyślnie będziesz mieć strony i łącza, ale jeśli masz włączone monitorowanie dzienników w swojej subskrypcji, zobaczysz opcję monitorowania dzienników: strony i monitorowanie dzienników: zdarzenia.

Wszystko, co musisz zrobić, to użyć OQL do filtrowania stron, tutaj patrzymy na strony SEO Active na 18 sierpnia, konkretnie dla grupy stron Blog:

Następnie możesz użyć menu rozwijanego („DODAJ KOLUMNY”), aby dodać odpowiednie dane do wyszukiwania:

Następnie kliknij „ZAPISZ FILTRY”, aby zapisać niestandardowy filtr, który będzie dostępny w sekcji „Własne filtry”


Alarm dziennika/powiadomienia

Niedawnym dodatkiem do naszych aktualizacji funkcji na 2021 r., który można przeoczyć, jest opcja włączenia alertów dzienników — to świetny sposób, aby być świadomym wszelkich problemów z przetwarzaniem dzienników. Więc zamiast czekać na wykrycie problemu z jakimikolwiek depozytami po zalogowaniu się na platformę, włącz alerty dziennika, aby poinformować Cię, kiedy dzienniki nie zostały ostatnio zdeponowane lub co zostało zdeponowane, nie jest uważane za przydatne.

Jest to całkiem proste w użyciu, wejdź do swojego projektu z włączonym monitorowaniem dzienników i kliknij kartę „Narzędzia menedżera dzienników”:

Po przejściu do raportu Narzędzia menedżera dzienników kliknij „Konfiguruj powiadomienia”:

Stąd będziesz mógł włączyć powiadomienia i zdefiniować próg, w którym należy się z Tobą skontaktować, jeśli nie zostaną złożone żadne przydatne wiersze lub żadne nowe pliki.

Może to zaoszczędzić czas na odkrywaniu, co dokładnie poszło nie tak z niektórymi depozytami, co znacznie przybliża Cię do wcześniejszego uzyskania aktualnych raportów.

[Ebook] Cztery przypadki użycia do wykorzystania analizy dzienników SEO

Dowiedz się, jak pliki dziennika, jako jedyne wiarygodne źródło informacji o ruchu w witrynie, mogą dostarczyć łatwych odpowiedzi na trudne pytania dotyczące SEO.
Pobierz za darmo

​​Narzędzia menedżera dziennika

Ponieważ jesteśmy przy temacie dzienników, wydaje się stosownym wspomnieć, że raport Log Manager Tools to kolejny świetny obszar platformy, który często nie jest używany tak często, jak mógłby. To ładne małe centrum schowane na poziomie projektu, które składa się ze szczegółów dotyczących tego, co dokładnie jest deponowane, w odniesieniu do plików dziennika.

Kiedy wskoczysz, nie tylko zobaczysz dokładne pliki, które zostały zdeponowane, ale zobaczysz dokładną datę i godzinę każdego depozytu, podział każdego typu wiersza dziennika (OK, przefiltrowany, błędny), wykres, który monitoruje liczbę fałszywych trafień botów wykrytych na datę wpłaty, i można zobaczyć rozkład jakości zdeponowanych dzienników i rozkład przydatnych wierszy.

Jest to świetne miejsce do sprawdzenia jakości deponowanych plików, na przykład upewnienia się, czy pliki są skompresowane, jeśli faktycznie deponujesz, to wiersze związane z SEO, jak w przypadku wizyt organicznych i trafień botów, oraz weryfikacja częstotliwości deponowania.

Jeśli zaczniesz zauważać coś dziwnego w swoich raportach dziennika, doskonałym miejscem do rozpoczęcia dochodzenia są narzędzia Menedżera dzienników. Możesz odkryć, że zmienił się format wiersza dziennika i nasz zespół ds. obsługi klienta musi zaktualizować parser, a może zauważysz, że nazwa zasobnika uległa zmianie i musisz przesłać nam nowe dane uwierzytelniające. W każdym razie zawsze możesz rzucić okiem i skontaktować się z nami, jeśli potrzebujesz pomocy w kopaniu głębiej.

Spersonalizowane segmentacje

Na koniec nasz najnowszy dodatek do naszego arsenału, Spersonalizowane segmentacje! Mamy teraz kolekcję szablonów segmentacji, aby zainspirować nowych użytkowników Oncrawla, którzy nigdy nie pracowali nad segmentacją, lub aby jej rozwój był nieco płynniejszy.

Szybkie przeglądanie segmentacji, są one niezbędne do opracowania, ponieważ chcesz wiedzieć, na którą część witryny patrzysz podczas sprawdzania wyników indeksowania. Mogą być tak proste, jak grupowanie stron według pierwszej ścieżki w adresie URL lub mogą być tak szczegółowe, jak grupowanie stron według zakresu sesji GA.

Oprócz szablonów, które zawierają teraz kilka wskazówek, dlaczego należy ich używać, będziesz mieć również wiele szablonów dostępnych zgodnie z zewnętrznymi łącznikami danych skonfigurowanymi dla projektu.

Jeśli więc masz dane dziennika, otrzymasz sugestię szablonu dla wizyt SEO lub trafień botów, a jeśli masz podłączoną konsolę Google Search Console, zobaczysz opcję utworzenia segmentacji na podstawie pozycji lub stron rankingu.

Od Ciebie zależy, jak chcesz wyświetlić witrynę, jesteśmy tutaj, aby to trochę ułatwić. Więc śmiało, spróbuj i powiedz nam, co myślisz.

Rozpocznij bezpłatny 14-dniowy okres próbny

Przekonaj się sam, dlaczego Oncrawl jest najbardziej rozpoznawalną platformą pozycjonowania technicznego i danych na rynku! Nie jest wymagana karta kredytowa i żadne zobowiązania: tylko 14 dni pełnej wersji próbnej.
Rozpocznij okres próbny