Jak zoptymalizować budżet indeksowania
Opublikowany: 2017-07-05W maju zorganizowaliśmy seminarium internetowe w języku francuskim na temat budżetu indeksowania Google. Na swoim drugim webinarium z OnCrawl, Erle Alberton, były szef SEO w Orange & Sosh (francuski dostawca Internetu), a teraz Customer Success Manager w OnCrawl, przedstawia koncepcję budżetu indeksowania, najlepsze praktyki jego optymalizacji, czego należy unikać itp. Praktyczne przykłady zilustrują tę koncepcję, która została niedawno potwierdzona przez zespół Google.
Co Google mówi o budżecie indeksowania
W połowie stycznia Google opublikował na swoim blogu artykuł, w którym stwierdza: „nie mamy ani jednego terminu, który opisywałby wszystko, co oznacza „crawl budget” zewnętrznie. Innymi słowy, to, co my, SEO, uważamy za budżet indeksowania.
Gigant internetowy wskazuje również, że jeśli Twoje nowe strony są zwykle indeksowane tego samego dnia ich publikacji, to tak naprawdę nie musisz się martwić o budżet indeksowania. Stwierdza również, że jeśli witryna ma mniej niż kilka tysięcy adresów URL, zostanie zindeksowana poprawnie, ponieważ budżet indeksowania jest zwykle zarezerwowany dla witryn o dużej liczbie wyświetleń… Jest to zarówno dobre, jak i złe, ponieważ wszystkie witryny w Google Search Console mają budżet indeksowania. Możemy to łatwo zobaczyć w danych Google.
Z tego artykułu dowiadujemy się również, że Google stara się osiągnąć „limit szybkości indeksowania”, który ogranicza maksymalną szybkość pobierania dla danej witryny. Widzimy, że na przykład, gdy czas ładowania jest zbyt długi, Google tnie budżet prawie o 2. Mając to na uwadze, istnieją czynniki, które mogą wpłynąć na budżet indeksowania, takie jak zła architektura (system, kody statusu, struktura wewnętrzna ), słaba i / lub zduplikowana treść, pułapki na pająki itp.
Jak działa budżet indeksowania Google?
Indeksowanie Google to zestaw prostych kroków, które działają rekurencyjnie dla każdej witryny. Oto wykres z Google, na którym widzimy, że indeksowanie rozpoczyna się od trafienia na robota txt, a następnie rozdziela się na zestaw adresów URL, które są skompilowane na liście. Następnie Google próbuje je pobrać, porównując ze znanymi mu adresami URL oraz tymi, które ma już w kopii zapasowej.
Jego celem jest wyczerpujące i precyzyjne uzupełnienie indeksu. Widzimy, że nawet jeśli witryna jest w JavaScript, Google wyśle roboty indeksujące trzeciego poziomu. Nadal należy uważać na witryny JavaScript, ponieważ zużywają one dużo zasobów botów i są wysyłane średnio tylko raz na kwartał. Musimy ponownie przemyśleć naszą metodę, aby Google miał dostęp do stron poza nawigacją JavaScript.
Następnie Google sprawdzi stan aktualizacji strony (porównanie z wcześniej zaindeksowaną treścią), aby ocenić, czy strona jest ważna, czy mniej ważna. Rzeczywiście, Google musi zoptymalizować swoje zasoby indeksowania, ponieważ nie może zaindeksować każdej strony wszystkich witryn internetowych. Nazywa się to ważnością strony… jest to bardzo ważny wynik do naśladowania, którego szczegóły zobaczymy poniżej!
Fakt: jeśli Google optymalizuje, to dlatego, że jest ku temu powód
Budżet indeksowania zależy od:
- zdolność witryny do szybkiego odpowiadania;
- Poczytalność witryny – 4xx, 5xx, 3xx (gdy witryna zaczyna mieć błędy 404 lub 500, wpłynie to na budżet indeksowania, ponieważ zawsze dwukrotnie sprawdza, czy zostały wprowadzone poprawki);
- Jakość treści – semantyka i kompletność;
- Różnorodność kotwic (strona jest uważana za ważną, gdy otrzymuje dużo linków. Dzięki InRank OnCrawl możesz przeanalizować całość);
- Popularność strony – zewnętrzna i wewnętrzna;
- Czynniki możliwe do optymalizacji – uproszczenie indeksowania (zmniejsz rozmiar obrazu, pojemność do css, js, gif, czcionki itp.)
[Studium przypadku] Zwiększ budżet indeksowania na strategicznych stronach
Kluczowe składniki Google Page Ważność
Definicja ważności strony nie jest taka sama jak Page Rank:
- Lokalizacja strony w serwisie – głębokość indeksowania;
- Page Rank: TF/CF Page'a – Majestic;
- Wewnętrzny Page Rank — InRank OnCrawl;
- Rodzaj dokumentu : PDF, HTML, TXT (PDF jest zwykle ostatecznym dokumentem jakościowym, więc jest często indeksowany);
- Włączenie do sitemap.xml;
- Liczba linków wewnętrznych:
- Jakość/ważność kotwicy;
- Treść jakościowa: liczba słów, niewiele prawie duplikatów (Google będzie karać podobne treści, jeśli strony są zbyt blisko treści);
- Znaczenie strony „domowej”.
Jak zaplanować ważne adresy URL do indeksowania
Planowanie adresów URL: jakie strony Google chce odwiedzać i jak często?
W powyższym przykładzie (obserwacja częstotliwości indeksowania tej samej witryny) Google nie indeksuje z tą samą częstotliwością w różnych grupach. Widzimy, że kiedy Google indeksuje część witryny, wpływ rankingu jest szybko widoczny.
Więcej informacji o budżecie indeksowania Google
- 100% witryn Google Search Console zawiera dane indeksowania;
- Możemy śledzić jego zachowanie podczas indeksowania dzięki analizie logów, która pomaga szybko wykryć nieprawidłowości w zachowaniu bota;
- Zła struktura wewnętrzna (paginacja, strony osierocone, pajęcze pułapki) może uniemożliwić Google indeksowanie właściwych stron;
- Budżet indeksowania jest bezpośrednio powiązany z rankingiem.
Najpierw szybkość strony
Najważniejszym czynnikiem jest czas ładowania strony, ponieważ odgrywa on decydującą rolę w budżecie indeksowania. Rzeczywiście, żyjemy dzisiaj w mobilnym świecie. Twoim najlepszym atutem jest zatem czas ładowania strony, aby zoptymalizować budżet indeksowania i SEO. Wraz z rewolucją mobilną czas ładowania jest istotnym czynnikiem w ocenie jakości witryny. Jego zdolność do szybkiego reagowania — zwłaszcza w przypadku urządzeń mobilnych i najpierw indeksowania urządzeń mobilnych.
Aby go zoptymalizować, możemy skorzystać z rozwiązań CDN (Content Delivery Network), takich jak Cloudflare. Dzięki tym rozwiązaniom roboty Google mogą znajdować się jak najbliżej zasobów i ładować strony tak szybko, jak to możliwe.
Google stale testuje zdolność witryny do szybkiego reagowania. Jakość architektury i kodowania ma duży wpływ na notację Google.
Czas ładowania
To pierwszy czynnik alokacji budżetu indeksowania!
Jeśli chodzi o serwer , musisz:
- Unikaj przekierowań;
- Autoryzuj kompresję;
- Popraw czas reakcji.
Powyżej przykład z witryną Manageo , która miała liniowy budżet indeksowania i gdzie możemy zauważyć liniowy wzrost. W maju następuje spadek liczby stron indeksowanych dziennie, a co za tym idzie zmiana szybkości witryny. Google widzi, że witryna reaguje wolniej, więc zmniejsza o połowę budżet indeksowania. Aby to wszystko naprawić, musisz zoptymalizować swoje kody po stronie serwera, zmniejszyć przekierowania, zastosować kompresję i tak dalej.
Z przodu musisz:
- Obsługuj buforowanie przeglądarki
- Zmniejsz rozmiar zasobów (optymalizacja obrazu, użyj CDN/leniwego ładowania/usuń JS, który blokuje wyświetlanie;
- Używaj skryptów asynchronicznych.
Spadek jakości = koniec miłości = koniec budżetu
Aby upewnić się, że IS jest czysty, należy sprawdzić kody stanu wysyłane z powrotem do robotów Google. To jedyny sposób, w jaki Google może sprawdzić, czy jakość Twojego kodu i architektury jest czysta.
Śledzenie ich ewolucji w czasie zapewnia, że aktualizacje kodu są przyjazne dla SEO. Google wydaje dużo na zasoby (css, img, js), więc upewnij się, że są one bezbłędne.
Unikalna i bogata treść
Strona jest ważniejsza, im bogatszy jest jej tekst. Jak pokazano powyżej, liczba stron zindeksowanych i niezindeksowanych przez Google jest powiązana z liczbą słów znajdujących się na stronie. Dlatego Twoje strony powinny być ulepszane i aktualizowane tak regularnie, jak to możliwe.
Uważaj na kanoniczne i duplikaty treści
Google wyda dwa razy więcej budżetu, gdy dwie podobne strony nie będą wskazywać tego samego kanonicznego adresu URL. W związku z tym zarządzanie kanoniczne może stać się krytyczne dla witryn z aspektami lub linkami zewnętrznymi z queryString.
Zarządzanie treścią prawie zduplikowaną i kanoniczną staje się ważnym aspektem optymalizacji budżetu indeksowania.
Struktura wewnętrzna i rozkład InRank
Strony generujące wizyty SEO są uważane za aktywne. Są to te, które znajdują się na szczycie architektury witryny. Z drugiej strony widzimy tutaj, że na stronie 15 pojawia się grupa stron. Być może te strony są znacznie częściej wyszukiwane przez użytkowników niż myślałeś i wymagałyby ulepszenia architektury, aby poprawić ich pozycję w rankingu.
Jak wiemy, im głębiej znajdują się strony, tym mniej Google je odwiedzi!
Czy moje strony z pieniędzmi są dobrze zlokalizowane?
Wskazówka: Jeśli chcesz zoptymalizować głębokość niektórych grup stron, nie wahaj się tworzyć planów witryn w formacie html, czyli stron, które są kluczowe dla zarządzania głębokością.
Google porówna strony Twojej struktury z zaindeksowanymi i aktywnymi. To powiedziawszy, korzystne byłoby rozwiązanie problemu osieroconych stron, na które Google niepotrzebnie wydaje budżet, i naprawienie architektury witryny, aby zwracały linki do aktywnych, ale niezwiązanych ze strukturą stron.
Czasami strony nie otrzymują już linków, nazywane są stronami osieroconymi. Z drugiej strony Google nie zapomniał o nich. Będzie ich nadal odwiedzał. Nie otrzymują już linków, więc tracą na znaczeniu, ale na odpowiednim wykresie niektóre osierocone strony nadal są odwiedzane przez SEO. Musisz wiedzieć, jak szybko je zidentyfikować i naprawić problemy z łączeniem, które występują w architekturze. To świetny sposób na optymalizację budżetu indeksowania.
Błędy, których należy unikać
- Robots.txt w 404;
- Sitemap.xml i sitemap.html nieaktualne;
- 50x / 40x / miękkie błędy 404;
- Posiadanie przekierowań łańcuchowych;
- błędy kanoniczne;
- Zduplikowana treść (stopka) / prawie duplikat / HTTP vs HTTPS;
- Zbyt długi czas odpowiedzi;
- Zbyt duże obciążenie strony;
- AMP/ błędy. Protokół ten jest szeroko stosowany przez Google, zwłaszcza w witrynach handlu elektronicznego (nie tylko witrynach multimedialnych);
- Złe linkowanie wewnętrzne + Rel=nofollow;
- Używanie JS bez żadnej innej alternatywy.
Wnioski
Aby zoptymalizować budżet indeksowania, musisz:
- Poznaj swoje strony dotyczące pieniędzy i poznaj reakcje Google;
- Popraw czas ładowania;
- Zoptymalizuj swoje wewnętrzne linki: umieść wszystkie strony z pieniędzmi na górze struktury;
- Napraw swoje osierocone strony;
- Dodaj tekst do swoich stron z pieniędzmi;
- Aktualizuj w pełni swoje strony z pieniędzmi – świeżość;
- Zmniejsz swoje słabe treści i duplikaty;
- Zoptymalizuj swoje kanoniczne, obrazy, wagę zasobów;
- Unikaj przekierowań łańcuchowych;
- Monitoruj swoje logi i reaguj, gdy pojawią się nieprawidłowości (sprawdź ten przypadek użycia z Manageo podczas SEOcamp Lyon na ten temat).
Aby zoptymalizować budżet indeksowania, musisz dokładnie monitorować robota Google
Niektóre momenty ścieżki Google w Twojej witrynie są ważniejsze niż inne, więc musisz wiedzieć, jak je zoptymalizować.
Aby zoptymalizować budżet indeksowania, konieczne jest prawidłowe zarządzanie migracją HTTPS (HTTP2)
Musisz być w stanie go śledzić i monitorować. Rzuć wyzwanie swoim zespołom IT, aby przeprowadziły migrację do HTTP2 z HTTPS.
OnCrawl pomaga śledzić budżet indeksowania Google na co dzień i szybko ukierunkowywać poprawki i zmiany strukturalne w celu poprawy wydajności SEO.