Tautan internal: bagaimana menentukan halaman yang paling penting untuk ditautkan?

Diterbitkan: 2021-05-03

Jika tautan eksternal (tautan balik) adalah salah satu area perbaikan yang sering disebut-sebut untuk meningkatkan SEO Anda, tautan internal sering diabaikan, tetapi juga penting. Faktanya, struktur hubungan internal yang baik dapat membuat semua perbedaan di sektor yang sangat kompetitif.

Jika, untuk situs kecil, menentukan halaman terpenting untuk ditautkan terlebih dahulu bisa menjadi tugas yang relatif mudah, bagaimana dengan situs dengan ribuan atau bahkan jutaan halaman?

Dalam artikel hari ini, saya akan menjelaskan metodologi yang dapat Anda terapkan pada proyek Anda untuk menentukan halaman prioritas.

Analisis N-gram dari kata kunci kami

Pertama, kita perlu memahami kata kunci apa yang paling sering digunakan untuk mencari produk atau layanan kita. Jika Anda pernah membuka laporan Google Search Console, Anda mungkin akan memperhatikan bahwa banyak struktur kata kunci yang ada. Misalnya, untuk pembelian tiket pesawat antara dua kota yang berbeda, mari kita ambil Lyon dan Barcelona, ​​pencariannya mungkin:

  • Penerbangan lyon barcelona
  • Penerbangan lyon barcelona
  • Penerbangan murah lyon barcelona
  • Dll.

Memiliki jenis pluralitas struktur kata kunci ini tidak spesifik untuk industri perjalanan, dan Anda mungkin memiliki situasi serupa di industri Anda sendiri.

Namun, penting untuk mengetahui struktur mana yang paling banyak digunakan agar dapat melakukan analisis kami dengan benar. Bagaimana kita bisa melakukan ini? Cukup dengan melakukan analisis n-gram (urutan N kata yang digunakan sebagai kata kunci) dari data Google Search Console kita sendiri.

Sebelum menjelaskan bagaimana melakukan ini, izinkan saya mengklarifikasi satu hal: sayangnya, data Google Search Console tidak sempurna.

[Studi Kasus] Bagaimana SEO berorientasi bisnis meningkatkan lalu lintas dan konversi

Berkat strategi SEO yang unggul yang berfokus pada pengelolaan duplikat konten, peningkatan struktur situs, dan analisis perilaku Googlebot, carwow tumbuh sebagai bisnis. Temukan cara menunjukkan hasil nyata dari strategi SEO berdasarkan ROI bisnis.
Baca studi kasus

Keterbatasan

Sebelum memulai analisis, kami perlu mengetahui bahwa metrik yang ditampilkan oleh alat saat Anda menyertakan dimensi "kueri" hanya mewakili 30-50% (angka persisnya akan bergantung pada situs Anda) dari total yang ditampilkan jika Anda menyertakan dimensi "halaman", misalnya.

Dengan kata lain: alat tersebut mengalami sampling dimensional. Ini berarti bahwa metrik yang dikembalikan oleh Google Search Console akan berbeda tergantung pada apa yang Anda analisis (kueri, halaman ...). Saya juga harus menunjukkan bahwa saya memperoleh data ini menggunakan API, yaitu dengan berinteraksi dengan semua data yang tersedia, alih-alih melalui antarmuka yang dikenal semua orang, yang hanya memungkinkan Anda untuk menganalisis maksimum 1000 elemen.

Jika Anda bekerja dengan Python, Anda dapat membaca dokumentasi resmi Google atau, lebih baik lagi, menggunakan perpustakaan ini yang akan menghemat banyak waktu Anda. Saya sendiri menggunakannya secara teratur.

Meskipun demikian, Google Search Console masih lebih lengkap daripada alat pihak ketiga lainnya seperti SEMrush, SEObserver, Ahrefs atau Sistrix, untuk menyebutkan hanya yang paling terkenal.

Metodologi untuk mendapatkan n-gram Anda

Untuk mendapatkan n-gram Anda, Anda harus mengikuti prosedur ini:

Unduh data Google Search Console Anda

Penting untuk mengunduh data Anda untuk satu vertikal. Karena n-gram bagian Penerbangan dan bagian Kereta di situs Anda mungkin akan berbeda, jika Anda mencampur data, Anda mungkin mendapatkan n-gram yang valid hanya untuk vertikal yang paling banyak dicari.

Jika situs Anda baru atau jarang muncul di halaman pertama, saya sarankan Anda menggunakan sumber data tambahan.

Hapus variabel

Dalam beberapa kasus, Anda mungkin perlu menghapus beberapa elemen dalam kata kunci ini. Misalnya, daftar saya hanya berisi 4 kata kunci:

  • Penerbangan paris roma
  • Penerbangan murah paris roma
  • Penerbangan lyon barcelona
  • Penerbangan murah lyon barcelona

Saya ingin mendapatkan n-gram dalam bentuk struktur, yang berisi variabel. Di sini, misalnya, saya hanya ingin menyimpan: penerbangan {{origin}} {{destination}} dan penerbangan murah {{origin}} {{destination}} , tanpa kota. Dalam kasus Anda, Anda mungkin harus mengganti nama produk Anda, ukurannya, dll… Itu akan tergantung pada industri Anda.

Hitung n-gram dan ambil volume pencarian

Anda dapat menggunakan sistem apa pun yang Anda inginkan: Dalam kasus saya, saya menggunakan Python, yang memiliki keuntungan karena sederhana dan dapat menangani jumlah data yang kami miliki di komputer biasa (tanpa merusaknya).

 #impor perpustakaan
koleksi impor
impor nltk
impor numpy sebagai np
impor panda sebagai pd

#buat daftar kata kunci unik
list_of_keywords = laporan['query'].tolist()

#buat daftar kata yang terdapat dalam kata kunci tersebut
list_of_words_in_keywords = [x.split(" ") untuk x dalam list_of_keywords]

#hitung yang paling umum
jumlah = koleksi.Penghitung()
untuk frasa di list_of_words_in_keywords:
  counts.update(nltk.ngrams(frase, 1))
  counts.update(nltk.ngrams(frase, 2))

Anda juga dapat menggunakan fungsi asli Oncrawl untuk menganalisis konten Anda dan menemukan beberapa n-gram yang belum muncul di Google Search Console (belum).

Kemudian, Anda harus mengambil volume pencarian untuk masing-masing struktur ini, untuk mendapatkan tabel seperti di bawah ini. Tabel ini menunjukkan struktur yang paling umum: struktur yang memiliki jumlah tayangan tertinggi untuk vertikal kami.

pertanyaan menghitung tayangan
Penerbangan {asal} {tujuan} 50 167000
Penerbangan murah {asal} {tujuan} 676 30000
Tiket {asal} {tujuan} 300 97000

Kerja bagus untuk berhasil melewati tahap ini. Saya dapat memberitahu Anda ingin tahu untuk apa kami akan menggunakan informasi ini. Jawabannya ada di part selanjutnya

[Studi Kasus] Bagaimana SEO berorientasi bisnis meningkatkan lalu lintas dan konversi

Berkat strategi SEO yang unggul yang berfokus pada pengelolaan duplikat konten, peningkatan struktur situs, dan analisis perilaku Googlebot, carwow tumbuh sebagai bisnis. Temukan cara menunjukkan hasil nyata dari strategi SEO berdasarkan ROI bisnis.
Baca studi kasus

Mengekstrak volume pencarian

Mari kita ingat bahwa tujuan kita adalah menentukan halaman yang paling penting untuk ditautkan terlebih dahulu.

Untuk memahami halaman mana yang memiliki potensi lalu lintas tertinggi, kita perlu mengambil volume pencarian dari berbagai struktur kata kunci yang paling umum, untuk setiap halaman. Kami hanya akan memperhitungkan volume pencarian di sini; gagasan CTR akan datang nanti!

Apakah Anda mulai memahami untuk apa langkah sebelumnya? Untuk mendapatkan efisiensi, penggunaan API adalah wajib. Ada banyak solusi, yang sebagian besar merupakan solusi berbayar. Jika Anda menggunakan DataForSEO, memperoleh volume untuk 350.000 kata kunci akan dikenakan biaya kurang dari 40€, jadi kami juga tidak membicarakan tentang investasi yang signifikan.

Di akhir langkah ini, Anda akan memiliki file dengan potensi volume per URL. Ini adalah jumlah volume n-gram paling umum yang dihitung pada langkah sebelumnya.

Menggabungkan data

Pada tahap ini, kami jelas tidak dapat menggunakan data ini untuk memprioritaskan halaman terpenting dari situs kami. Kenapa tidak?

Jangan mencampur volume dan lalu lintas!

Dalam beberapa kasus, bahkan jika Anda berada di posisi pertama, CTR Anda mungkin masih rendah. Hal ini sering disebabkan oleh banyaknya iklan dan fitur SERP yang ditampilkan oleh Google di atas halaman Anda. Berikut adalah contoh kueri cuaca di mana elemen Google pertama sangat menarik perhatian pengguna jauh sebelum pengguna dapat mencapai hasil organik pertama.

Keterbatasan n-gram

Pentingnya kata kunci ekor panjang dapat bervariasi tergantung pada sektornya. Struktur yang tidak akan dipertahankan pada langkah pertama (atau disembunyikan oleh Google Search Console) tetap dapat mewakili bagian yang menarik dari potensi tersebut. Karena itu, kita harus menyertakan mereka.

Pentingnya setiap halaman

Sebagai seorang ahli SEO, tujuan kami bukan untuk menghasilkan lalu lintas, tetapi untuk menghasilkan penjualan melalui mesin pencari. Oleh karena itu, jika Anda bisa, penting untuk melengkapi analisis ini dengan data dari departemen penjualan Anda. Misalnya, data margin penjualan dapat membantu Anda menentukan URL mana yang harus Anda prioritaskan.

Mari kita ambil tabel dari akhir langkah sebelumnya, dan tambahkan data lain yang berguna untuk diukur:

  • Potensi paparan (volume / tayangan)
  • Lalu lintas aktual (sesi / klik)
  • Pendapatan (rasio konversi / margin / pendapatan)

Berikut adalah contoh cara menyajikan tabel ini:

Membobot data

Untuk mengklasifikasikan setiap bagian konten yang berbeda sesuai dengan potensi paparannya, potensi lalu lintas, dan pendapatannya, Anda harus memutuskan seberapa besar bobot masing-masing elemen ini.

Saya tidak dapat mengusulkan persentase standar; terserah Anda untuk menentukan persentase yang sesuai dengan situasi Anda sendiri.

Standardisasi

Harap dicatat bahwa kami belum dapat menentukan pentingnya setiap halaman kami. Hasil yang kami peroleh dengan pembobotan data yang kami peroleh sebelumnya belum valid.

Penjelasan: Menurut definisi, tayangan akan lebih tinggi daripada klik dan sesi. Hal ini terutama berlaku di industri dengan RKPT rendah. Tanpa memproses data kami sebelumnya, kami berisiko membebani tayangan (dan sesi yang terlalu rendah).

Bagaimana kita memecahkan masalah ini? Dengan menstandardisasi data kami! Proses ini memungkinkan kita untuk mengubah ukuran variabel numerik sehingga dapat dibandingkan pada skala umum (sumber). Melalui manipulasi matematika, distribusi data kuantitatif kami akan memiliki nilai rata-rata 0 dan standar deviasi 1.

Jika Anda penasaran, rumus matematikanya adalah sebagai berikut:

X_standar = nilai standar
X = nilai awal
= mean (rata-rata) dari distribusi kami
= simpangan baku dari distribusi kita

Sangat mudah untuk menerapkan rumus ini ke data Anda:

Terapkan rumus ini ke semua data yang ingin Anda pertimbangkan dalam perhitungan Anda. Ini pasti akan menghilangkan masalah kelebihan berat badan metrik.

Menghitung skor

Setelah Anda menentukan bobot dan menghitung nilai standar Anda, Anda dapat menetapkan skor untuk setiap URL Anda untuk menentukan kepentingannya. Dalam contoh ini, kami memiliki 4 metrik, masing-masing berbobot sama pada 25%, tetapi Anda jelas dapat menggunakan angka lain.

Oleh karena itu, metodologi ini memungkinkan Anda untuk menempatkan URL pertama yang secara objektif adalah yang terbaik: volume pencarian yang lebih rendah, tetapi tayangan yang tinggi, dan di atas semua itu RKPT yang mengesankan.

Dengan informasi ini, Anda akan dapat menentukan struktur tautan internal Anda dengan cara yang jauh lebih komprehensif dan relevan daripada jika Anda mendasarkannya pada satu kriteria, seperti volume pencarian. Terserah Anda untuk menghubungkan:

  • Dari halaman rumah: halaman yang paling penting
  • Dari kategori: halaman paling penting dari kategori yang dimaksud
  • Dan seterusnya.

Kesimpulan

Metodologi n-gram efisien dan memiliki keuntungan dapat diterapkan pada banyak proyek. Anda hanya perlu menyesuaikannya dengan menggunakan data terpenting dari industri Anda. Terlepas dari penggunaan konsep matematika yang mungkin baru bagi sebagian orang (standarisasi), konsep ini juga mudah dijelaskan dan dipraktikkan dengan alat yang Anda miliki.

Ini akan memberi Anda informasi yang diperlukan untuk membangun mesh internal Anda berdasarkan potensi dan hasil halaman Anda. Tugas yang terkadang rumit untuk didapatkan untuk situs besar.

Yang harus Anda lakukan adalah menerapkannya!