RegEx untuk SEO: 12 Penggunaan Ekspresi Reguler

Diterbitkan: 2024-06-07

Pengembang situs web dan pemasar konten tahu bahwa data adalah emas. Hal ini dapat memberikan dasar wawasan mendalam yang Anda gunakan untuk mengubah atau menyempurnakan strategi digital.

Namun bagaimana Anda mendapatkan hasil maksimal dari data Anda?

Anda mungkin memiliki Google Search Console dan mengetahui fungsi kueri utamanya: "sama dengan" dan "berisi". Hal ini dapat memberi Anda cara untuk mengumpulkan informasi data dengan cara yang dapat Anda gunakan untuk membuat laporan bermakna dengan wawasan strategis.

Bagaimana jika Anda dapat melakukan penelusuran yang lebih canggih daripada sekadar konektor bawaan seperti "sama dengan" dan "berisi"? Itulah janji RegEx, alat pengkodean yang mudah diimplementasikan dan digunakan.

Di sini kami akan memberi Anda dasar-dasar tentang RegEx, perbedaannya, dan bagaimana Anda dapat menggunakannya untuk meningkatkan permainan SEO Anda.

Apa Itu RegEx dan Seperti Apa Bentuknya?

RegEx telah menjadi rahasia umum di kalangan pengembang sejak lama. Ini menawarkan fleksibilitas luar biasa dalam cara Anda menelusuri dan menyusun data, memungkinkan Anda menyesuaikan laporan dengan wawasan mendalam yang tidak tersedia hanya dengan alat Google Search Console bawaan.

RegEx adalah singkatan dari Regular Expression. Ini adalah alat pengkodean yang bertindak sebagai fungsi pencarian. "Temukan dan Ganti", yang mungkin digunakan oleh hampir semua orang yang baru-baru ini menggunakan dokumen teks, sebenarnya adalah RegEx.

Memang benar RegEx ada dimana-mana, termasuk pada alat yang digunakan orang sehari-hari seperti Microsoft Word, Notepad, dan mesin pencari Google. Jadi meskipun kodenya, dan terintegrasi dengan mulus ke banyak bahasa pemrograman, potensi dan fungsinya mudah dimengerti.

Manfaatnya dalam mengembangkan strategi SEO Anda sangat besar, khususnya dengan membantu Anda mengidentifikasi pola pencarian dan mengakses data yang tersembunyi di bawah permukaan Google Search Console.

Sebelum kita melanjutkan membahas RegEx dalam SEO, mari kita luangkan waktu sejenak untuk mendefinisikan string RegEx dan seperti apa tampilannya. Contoh sederhananya adalah rangkaian karakter ini:

  • /t[aeiou]+/g

RegEx ini mencari semua contoh huruf "t" yang diikuti dengan vokal. Bayangkan Anda menerapkan pola ini pada kalimat berikut:

  • Aku makan roti panggang sambil duduk di meja Greg.

RegEx akan mengambil hasil berikut:

  • Aku makan roti panggang sambil duduk di meja Greg.

Ini adalah contoh penerapan RegEx yang relatif mudah. Itu dapat memiliki rangkaian karakter yang lebih panjang dan lebih kompleks. Simbol tertentu juga memberikan "instruksi" tentang cara kerja RegEx, seperti tanda kurung siku yang mengidentifikasi rentang karakter yang dapat mengikuti "t" pada contoh. Tanda baca termasuk tanda tanya dan tanda bintang juga merupakan hal mendasar dalam string RegEx.

Untuk postingan blog ini, kami akan fokus hanya pada satu atribut filter RegEx yang penting untuk diketahui sebelum Anda menggunakan RegEx untuk mengoptimalkan pelaporan SEO dan audit SEO teknis. Itulah perbedaan antara "serakah" dan "malas" dalam pencocokan ekspresi reguler. Di RegEx, Anda dapat menerapkan kode pembilang yang membantu Anda memilih pola RegEx "serakah" atau pola RegEx "malas".

Pola RegEx Serakah

Mungkin mudah untuk melihat bahwa kemungkinan kecocokan untuk string pencarian RegEx bervariasi tergantung pada parameter pasti dari filter RegEx. Dalam contoh kita, ekspresi mengambil string pencarian terpanjang agar sesuai dengan polanya. Huruf "t" diikuti dengan vokal apa pun yang pola ekspresi regulernya mengarah pada hasil yang mengambil "te" dalam "ate" dan juga "toa" dalam "toast".

Karena pola RegEx ini mencari string terpanjang, pola ini dikenal sebagai "serakah". Faktanya, hasil dari "toast" bukan sekedar "toa" tetapi lebih tepatnya "to" dan "toa". Fakta bahwa Anda akan mendapatkan hasil seperti ini penting untuk diketahui sehingga Anda dapat sepenuhnya memahami kecocokan pola RegEx Anda.

Pola Malas

Dalam pola malas, RegEx mencari kecocokan terpendek dengan sebuah string. Dalam contoh kita, pola RegEx yang malas tidak lagi mengambil "toa" di "toast" sebagai hasil terpisah; itu akan berhenti dengan "ke," karena itu adalah string terpendek yang cocok dengan kueri RegEx.

Mari kita gunakan contoh penelusuran RegEx yang mencari huruf "y", diikuti sejumlah karakter, diikuti dengan "l".

  • Dalam pola serakah, RegEx akan mengambil "teriakan" dan "kuning" dalam kumpulan data yang menyertakan kata-kata tersebut.
  • Dalam pola malas, RegEx hanya akan mengambil "yel" dalam kumpulan data yang sama.

Apa Manfaat Menggunakan Ekspresi Reguler?

RegEx adalah alat yang ampuh untuk menghasilkan laporan tentang data pencarian Anda. Dengan melihat secara mendalam aktivitas digital Anda, Anda dapat memanfaatkan wawasan yang dapat Anda gunakan untuk mengoptimalkan konten, melakukan riset kata kunci, dan banyak lagi. Saat Anda mendalami Google Analytics, RegEx dapat membantu Anda melampaui fungsi pengantar platform yang sederhana.

Mari kita uraikan: bagaimana Google Analytics dan ekspresi reguler bekerja sama untuk SEO dan bagaimana penelusuran ekspresi reguler Google dapat mengoptimalkan data Anda.

12 Penggunaan RegEx Teratas untuk Pengoptimalan Mesin Pencari

RegEx memiliki kegunaan yang jelas: mengidentifikasi konten duplikat, misalnya, serta menemukan teks tautan terbaik yang paling mungkin cocok dengan kueri penelusuran. Namun setidaknya ada selusin cara RegEx dapat membantu SEO Anda. Berikut adalah beberapa penggunaan ekspresi reguler yang terbaik.

1. Menganalisis URL

Mungkin terasa aneh ingin menganalisis URL dengan RegEx, namun pikirkan skenario e-commerce: Kemungkinan Anda memiliki ribuan URL individual yang semuanya berhubungan dengan halaman produk. Kemampuan untuk mendalami data konversi Anda dan memfilter URL spesifik yang sesuai dengan aktivitas konsumen sangatlah berharga.

Anda dapat menggunakan data ini untuk mengidentifikasi URL yang dilihat dan ditanggapi oleh pelanggan — dan URL mana yang tidak dilihat dan ditanggapi. RegEx memungkinkan Anda menggunakan string seperti kategori produk atau nama di dalam URL untuk mengambil aktivitas grup URL tersebut. Anda juga dapat melakukan beberapa analisis URL cerdas di mana Anda melacak daftar URL yang dikunjungi pengguna untuk mengembangkan gambaran yang jelas tentang perjalanan pelanggan.

2. Melakukan Analisis Kata Kunci

Anda dapat menggunakan RegEx untuk mendalami kata kunci yang dicari dan digunakan orang untuk menemukan dan terlibat dengan situs Anda. Ini adalah alat canggih yang memungkinkan Anda mengidentifikasi penelusuran khusus, string dengan konversi tinggi, dan frasa kunci yang kemampuannya untuk mendorong konversi dapat Anda manfaatkan dengan strategi konten Anda.

RegEx memungkinkan Anda mencari string, menggunakan pola serakah atau malas, yang mungkin sulit divisualisasikan menggunakan alat sederhana Google Search Console yang sudah ada yaitu "berisi" atau "sama dengan". Di sini Anda dapat menemukan kata kunci ekor panjang yang berkinerja tinggi namun terkadang sulit dikenali yang dapat membantu mendorong penjualan Anda.

3. Membuat Pengelompokan dan Acara Saluran Khusus

Google juga suka menawarkan kategori terkait sumber lalu lintas dan aktivitas. Platform ini memiliki pengelompokan saluran yang telah ditetapkan sebelumnya yang memungkinkan Anda mengidentifikasi lalu lintas apa yang datang ke situs Anda melalui saluran ini. Ini juga menyiapkan peristiwa seperti "tampilan halaman" yang mungkin Anda lacak dalam strategi analisis dasar.

Dengan RegEx, Anda dapat menyesuaikan semua informasi analitik ini. Anda dapat membuat grup saluran yang relevan dengan strategi Anda, seperti "lalu lintas yang bersumber dari pengguna aplikasi di benua Eropa". Manfaatnya jelas: Anda dapat menetapkan grup Anda ke kriteria apa pun yang paling penting bagi Anda untuk memahami keberhasilan strategi pemasaran digital Anda.

4. Mengidentifikasi Halaman Berkinerja Buruk

Ingat catatan kami tentang situs e-commerce dengan ribuan URL? Ini adalah keadaan umum bagi banyak pengembang situs web: indeks halaman situs web yang panjang dan kebutuhan analisis yang dapat disesuaikan untuk melihat halaman mana yang memberikan keuntungan terbaik. Namun tidak berhenti disitu saja, karena beberapa URL mungkin mengalami kesalahan. Pola aktivitas pengguna mungkin berbeda dibandingkan halaman lain. Mungkin pengunjung tidak melakukan konversi atau tidak mengklik ke halaman lain.

RegEx memungkinkan Anda mendalami aktivitas yang tertaut ke masing-masing halaman ini. Anda dapat menggunakan data ini untuk mulai memperbaiki kesalahan atau melakukan analisis tingkat halaman.

Ini berguna untuk pemeliharaan berkelanjutan. Ini juga dapat menjadi langkah pertama untuk melihat apakah modifikasi dalam strategi Anda dapat membantu mengoptimalkan apa yang berjalan dengan baik dan memperbaiki kekurangan yang ada.

5. Tidak termasuk Referensi

Laporan lalu lintas Anda di Google Analytics 4 biasanya mencakup semua sumber rujukan, namun Anda mungkin sebenarnya ingin mengecualikan beberapa rujukan lalu lintas dari pelaporan Anda. Katakanlah Anda menjalankan kampanye bayar per klik. Pola lalu lintas yang membantu Anda melacak kinerja kampanye mungkin sebagai berikut:

  • URL Iklan → URL Konfirmasi Pembelian

Dalam contoh ini, URL iklan adalah sumber lalu lintas. Namun yang lebih umum, pola yang muncul dalam analitik adalah sebagai berikut:

  • URL Iklan → Gerbang Pembayaran → URL Konfirmasi Pembelian

Alih-alih mengidentifikasi URL iklan sebagai sumber rujukan untuk lalu lintas pembelian, analisis mengidentifikasi gateway pembayaran. Ini jelas tidak ideal dari sudut pandang analitik karena pelanggan Anda dapat tiba di gateway pembayaran dari sejumlah sumber berbeda.

Dengan menggunakan pengecualian rujukan, Anda dapat menghapus sumber rujukan potensial, seperti gateway pembayaran dalam contoh ini, dari analitik Anda.

Pengecualian rujukan dapat dicapai dengan menggunakan RegEx di GA4:

  • Temukan opsi untuk "Konfigurasi pengaturan tag".
  • Pilih opsi untuk mengecualikan rujukan berdasarkan "Domain rujukan cocok dengan RegEx".
  • Masukkan string RegEx Anda.

Keuntungan menggunakan RegEx dengan cara ini adalah Anda tidak perlu mencantumkan beberapa domain yang ingin dikecualikan dalam pelaporan Anda; Anda cukup mengidentifikasi string RegEx.

6. Melakukan Segmentasi Pengguna Berdasarkan Perilaku Untuk Menciptakan Audiens

Sama seperti Anda menggunakan RegEx untuk membuat saluran khusus, Anda dapat menelusuri data analitik untuk mengungkap gambaran perilaku pengguna. Proses ini, yang disebut segmentasi perilaku, memungkinkan Anda membagi pengguna yang sesuai dengan kriteria tertentu ke dalam audiens yang tersegmentasi.

Ini adalah analisis komprehensif yang mencakup perjalanan pelanggan, saluran yang sering dikunjungi pengguna, dan pesan yang mereka tanggapi. Menyegmentasikan audiens memungkinkan Anda mengembangkan strategi pemasaran digital yang ditargetkan secara individual untuk setiap kelompok.

7. Melakukan Pemeriksaan Konsistensi Indeks

Sebuah tugas yang sering diserahkan kepada pengembang, pemeriksaan konsistensi indeks memastikan indeks situs lokal cocok dengan indeks database terkait. RegEx menawarkan kemudahan dan fungsionalitas yang unggul dalam tugas ini, karena Anda dapat menggunakan pola RegEx serakah atau RegEx malas untuk mengidentifikasi ketidakcocokan di antara keduanya dan memperbaikinya.

8. Mengevaluasi Konten dengan Mengidentifikasi Elemen HTML

Bagian dari SEO teknis adalah memastikan bahwa kode situs web Anda mudah dirayapi oleh mesin pencari. Kode secara umum harus terstruktur dan terorganisir dengan baik. Memiliki kode yang terlalu berantakan mungkin berdampak negatif pada SEO. RegEx dapat membantu Anda mengidentifikasi rangkaian kode "kikuk" di seluruh situs web Anda sehingga Anda dapat membersihkannya dalam proses pengoptimalan.

Pengembang dapat menilai kualitas konten "back end" dengan mencari kekurangannya. Perintah RegEx dapat membantu Anda mengidentifikasi elemen gaya kode yang buruk, seperti baris kosong yang berlebihan, spasi yang hilang, atau panjang baris kode yang mungkin terlalu panjang.

Ini adalah kejadian lain di mana RegEx adalah alat penghemat waktu yang sangat berharga ketika Anda memiliki situs web dengan ratusan, atau mungkin ribuan halaman.

9. Membuat Pengalihan Cerdas Dari File '.Htaccess'

File ".Htaccess" adalah file tersembunyi yang menyebabkan pengalihan otomatis dari satu halaman ke halaman lainnya. Katakanlah Anda telah mengembangkan dua konten seputar lini produk baru Anda: Yang pertama adalah wawancara dengan CEO Anda tentang proses pengembangan dan yang lainnya adalah perincian spesifikasi produk.

Mungkin Anda ingin membatalkan wawancara CEO sebulan setelah peluncuran. Dengan menggunakan RegEx, Anda dapat mengidentifikasi string pencarian yang mengarahkan orang ke konten tersebut dan menawarkan pengalihan cerdas ke konten yang sebenarnya Anda ingin mereka lihat.

10. Menemukan Pertanyaan Klien Setelah Mereka Membeli

Pemasar digital mungkin berasumsi bahwa pekerjaan mereka berakhir pada titik konversi. Namun data setelah pembelian dapat memberikan wawasan mendalam tentang kekhawatiran dan pengalaman pelanggan pasca pembelian. Apa yang ada dalam pikiran pelanggan baru-baru ini dapat memberi tahu Anda banyak hal tentang apakah produk tersebut berfungsi dan bagaimana Anda dapat merespons kekhawatiran tersebut secara proaktif.

Bayangkan Anda menjual penyedot debu yang canggih. Anda mungkin ingin tahu apakah orang-orang mencari informasi tentang istilah-istilah penting seperti "garansi", "masa pengembalian", "tidak berfungsi", "suku cadang pengganti", dan "keluhan".

Kueri RegEx dapat membantu Anda mengidentifikasi istilah kunci yang mungkin dicari pelanggan setelah pembelian sehingga Anda siap memberikan tanggapan. Respons tersebut mungkin berupa serangkaian Tanya Jawab untuk tim layanan pelanggan Anda atau halaman relevan di situs web Anda yang menyediakan informasi pengembalian dan garansi.

11. Membandingkan Lalu Lintas Merek dan Non-Merek

Satu pertanyaan penting bagi pemasar digital adalah segmen pengguna mana yang menelusuri berdasarkan identitas merek versus produk, layanan, atau industri. Bayangkan "Coca-Cola" sebagai mereknya, sedangkan "minuman ringan", "minuman berkarbonasi", "soda", atau "pemanis" adalah contoh istilah yang terkait dengan Coca-Cola. Dalam lalu lintas penelusuran, "Coca-Cola" dan "soda" merupakan istilah kunci yang potensial, namun yang satu spesifik untuk merek dan yang lainnya tidak.

Pemasar dapat menggunakan RegEx untuk membedakan antara pengunjung yang menelusuri merek dan istilah terkait merek, serta pengunjung yang menelusuri istilah yang tidak terkait merek. Dalam contoh ini, "Coca-Cola", "Coke", dan "Diet Coke" merupakan istilah kunci merek. Salah satu contoh laporan RegEx di Google Search Console yang membedakan jenis lalu lintas adalah kueri RegEx yang "menyertakan" atau "tidak termasuk" istilah bermerek yang Anda tentukan.

Bergantung pada cara Anda menggunakan RegEx, laporan "termasuk" Anda mungkin hanya berisi istilah bermerek berikut, atau mungkin berisi semua istilah. Jika Anda menggunakan pola RegEx yang lambat, Anda hanya dapat menangkap lalu lintas bermerek; dengan pola RegEx yang serakah, Anda dapat menangkap semuanya.

12. Melakukan Analisis File Log

Misalkan Anda ingin mengekstrak istilah-istilah kunci dari file log Anda. RegEx dapat membantu Anda melakukan hal ini secara efisien, meskipun nilainya muncul di setiap baris log dalam urutan yang berbeda atau tidak muncul di setiap baris log sama sekali. Dengan menggunakan RegEx, Anda dapat mengidentifikasi log yang relevan dengan analisis data Anda dan menggunakannya untuk membuat laporan yang kohesif.

Karena fleksibilitas RegEx, Anda dapat menerapkan pola malas untuk menghilangkan duplikasi dalam log berulang. Secara default, pola RegEx bersifat serakah. Gunakan karakter khusus untuk membatasi pencarian Anda pada pola malas jika perlu, misalnya dengan menggunakan "*?" alih-alih "*". Salah satu tipnya adalah memulai dengan kueri RegEx sederhana yang menawarkan transparansi ke dalam struktur log Anda sebelum menerapkan pola RegEx yang lebih kompleks.

FAQ