วิธีเริ่มต้นกับ Regex
เผยแพร่แล้ว: 2021-07-21Regex เป็นหนึ่งในทักษะทางเทคนิคที่มักถูกมองข้ามในด้านการตลาด สามารถใช้ใน Google Search Console, Google Analytics และ Google Data Studio สำหรับการดึงข้อมูลสำหรับ SEO
บทความนี้เน้นที่แนวคิดของ Regex อย่างสมบูรณ์ และความได้เปรียบในการใช้ประโยชน์จากการวิเคราะห์ข้อมูลโดยเป็นส่วนหนึ่งของบริการ SEO
วิทยาศาสตร์ข้อมูลและการวิเคราะห์ข้อมูลมีบทบาทสำคัญในอนาคตของ Search Engine Optimization ในทางปฏิบัติในปัจจุบัน เราไม่สามารถพึ่งพา On-Page, Off Page และ Technical SEO ได้เท่านั้น
Data SEO มีบทบาทอย่างมากในการได้ผลลัพธ์ที่ต้องการจากการจัดอันดับคำหลักและการเข้าชมแบบออร์แกนิก
Regex ช่วยในการแยกรูปแบบเฉพาะของอักขระจากชุดข้อมูลซึ่งเป็นทักษะที่สำคัญมากสำหรับนักแสดงหลายคนในพื้นที่ SEO:
- ผู้เชี่ยวชาญด้าน SEO
- ผู้ดูแลเว็บและทีมวิเคราะห์เว็บ
- นักวิจัย/วิศวกรข้อมูล
- ผู้เชี่ยวชาญด้านการตลาดดิจิทัล/ที่ปรึกษา
Regex คืออะไร?
Regex หรือที่เรียกกันทั่วไปว่า Regular Expressions เป็นหนึ่งในเครื่องมือที่ใช้สำหรับการจับคู่รูปแบบ Regex คือสตริงหรือชุดอักขระที่แสดงรูปแบบเพื่อจับคู่ จัดการ และกรองข้อความ
สตริง Regex อาจมีลักษณะดังนี้:
([0-9]+(\.[0-9]*)?)
ใช้ชุดอักขระ สัญลักษณ์ และองค์ประกอบอื่นๆ เพื่ออธิบายรูปแบบ รูปแบบอาจเป็นหมายเลขโทรศัพท์ URL วันที่หรือเวลา ที่อยู่ ตัวระบุ เช่น ข้อมูลอ้างอิงผลิตภัณฑ์ หรือแม้แต่ประโยคข้อความภายในหน้าโค้ด
จากนั้นคุณจะพบลำดับในข้อความหรือรายการที่ตรงกับรูปแบบที่คุณได้อธิบายไว้
[กรณีศึกษา] การปรับปรุงการจัดอันดับ การเข้าชมแบบออร์แกนิก และการขายด้วยการวิเคราะห์ไฟล์บันทึก
Regex ใช้ใน SEO อย่างไร
ในแนวทางปฏิบัติของ SEO จะช่วยในการกรองคำหลักหรือวลีที่เว็บไซต์ได้รับการเข้าชม ในทางกลับกัน ตัวกรองนี้จะช่วยในการวิเคราะห์พฤติกรรมและความตั้งใจในการค้นหาของผู้ใช้ของคุณ สิ่งนี้มีความสำคัญมากขึ้นเรื่อยๆ นับตั้งแต่การอัปเดต BERT ของ Google Search Engine ซึ่งช่วยให้ Google ระบุความตั้งใจของผู้ใช้ได้ดีขึ้นโดยใช้ NLP
หลังจากนี้เสิร์ชเอ็นจิ้นมุ่งเน้นไปที่การทำความเข้าใจเจตนาของผู้ใช้และจัดอันดับเนื้อหาที่น่าสนใจที่สุดในหน้าแรกของ SERP Google Analytics และ Google Search Console เป็นเครื่องมือฟรีที่ใช้กันอย่างแพร่หลายใน SEO ที่สนับสนุนการใช้เทคโนโลยี Regex
ทักษะ Regex พื้นฐาน: Operators
ก่อนดำเนินการต่อไป คุณต้องเข้าใจตัวดำเนินการเพื่อใช้ Regex อย่างมีประสิทธิภาพ ตัวดำเนินการ Regex แบ่งออกเป็นห้าประเภท:
- ชุดอักขระ
- ไวด์การ์ด
- สมอ
- กลุ่ม
- ตัวละครหนี
ตัวดำเนินการแต่ละตัวแสดงถึงประเภทของอักขระหรือคำสั่ง นี่คือโอเปอเรเตอร์หลักบางส่วน
คลาสตัวละคร
คลาสอักขระคือชุดหรือประเภทของอักขระ
- \d - ตรงกับตัวเลขใดหลักหนึ่ง
- \D – ตรงกับอักขระตัวใดตัวหนึ่งที่ไม่ใช่ตัวเลข
- \w - จับคู่ "อักขระคำ" ใด ๆ (ตัวอักษร ตัวเลข ขีดล่าง)
- \s – ตรงกับช่องว่างใดๆ (ช่องว่าง แท็บ …)
- \S – ตรงกับอักขระใดๆ ที่ไม่ใช่ช่องว่าง
- ?-i – ระบุการจับคู่แบบตรงตามตัวพิมพ์เล็กสำหรับอักขระต่อไปนี้ทั้งหมด
ไวด์การ์ด
สัญลักษณ์แทนไม่ได้ระบุอักขระเฉพาะที่ตรงกัน
- จุด (.) – ตรงกับอักขระตัวเดียว (ตัวอักษร ตัวเลข หรือสัญลักษณ์)
- เครื่องหมายคำถาม (?) – ตรงกับอักขระก่อนหน้า 0 หรือ 1 ครั้ง
- เครื่องหมายบวก (+) – ช่วยจับคู่อักขระก่อนหน้า 1 ครั้งขึ้นไป
- เครื่องหมายดอกจัน (*) – ช่วยจับคู่อักขระก่อนหน้า 0 ครั้งขึ้นไป
- ไปป์ (|) – สร้างการจับคู่ OR
สมอ
จุดยึดอธิบายส่วนของรูปแบบที่คุณพยายามจะจับคู่
- Caret (^) – บ่งชี้ว่า Regex ควรจับคู่อักขระที่จุดเริ่มต้นของสตริงหรือบรรทัด แทนที่จะเป็นที่ใดก็ได้ในสตริง
- เครื่องหมายดอลลาร์ ($) – ระบุว่า Regex ควรตรงกับอักขระที่ส่วนท้ายของสตริงหรือบรรทัด แทนที่จะเป็นที่ใดก็ได้ในสตริง
กลุ่ม
Groups คือวิธีจัดกลุ่มองค์ประกอบใน Regex
- วงเล็บ (()) – มัน "จับ" อักขระที่อยู่ในวงเล็บซึ่งอาจอธิบายได้ด้วยรูปแบบรอบตัวพวกเขา ซึ่งจับคู่กับ Regex ที่เหลือ คุณสามารถใช้กลุ่มการจับภาพได้หลายกลุ่ม และจะถูกระบุตามลำดับที่ปรากฏ
- วงเล็บเหลี่ยม ([]) – จับคู่ชุดอักขระที่ล้อมรอบในลำดับใดก็ได้ ที่ใดก็ได้ในสตริง
- เส้นประ (-) – ใช้ภายในวงเล็บเหลี่ยมเพื่อระบุช่วงของอักขระ เช่น 0-9 หรือ AZ
หนี
อักขระหลีกช่วยให้คุณใช้อักขระได้อย่างแท้จริง แม้ว่าโดยปกติแล้วจะตีความว่าเป็นตัวดำเนินการก็ตาม
- แบ็กสแลช (\) – ระบุว่าควรตีความอักขระที่อยู่ติดกันตามตัวอักษร แทนที่จะเป็นโอเปอเรเตอร์ Regex
ตอนนี้ มาดูตัวอย่างพื้นฐานสองสามอย่างเกี่ยวกับวิธีการใช้ใน Google Analytics และ Google Search Console
วิธีกรองตารางใน Google Analytics
Google Analytics เป็นหนึ่งในเครื่องมือฟรีที่ช่วยในการวิเคราะห์เส้นทางของผู้ใช้บนเว็บไซต์ของคุณด้วยความช่วยเหลือของข้อมูล ซึ่งรวมถึง:
- ผู้ชม: ข้อมูลประชากร
- การได้มา: ผู้ใช้มาถึงไซต์ของคุณอย่างไร
- พฤติกรรม: สิ่งที่ผู้ใช้ทำในเว็บไซต์ของคุณ
- Conversion: ไม่ว่าผู้ใช้จะบรรลุเป้าหมายการขายหรือการตลาดที่คุณตั้งไว้สำหรับพวกเขาในไซต์ของคุณหรือไม่
เราสามารถใช้ Regex เพื่อกรองข้อมูลใน Google Analytics และทำความเข้าใจพฤติกรรมของผู้ใช้
ในภาพด้านบน Regex /ebooks/|/tools/
ถูกใช้เพื่อกรองสองหน้าจาก 1,000 หน้าบนเว็บไซต์โดยใช้ |(ไปป์) ซึ่งหมายถึง “หรือ” สตริงนี้สามารถอ่านได้ดังนี้: “ค้นหาเฉพาะหน้าที่มี /ebooks/ หรือ /tools/
ในทำนองเดียวกัน คุณสามารถใช้สตริงอื่นๆ ทั้งหมดเพื่อเป็นผู้เชี่ยวชาญในการแยกแยะพฤติกรรมของผู้ใช้และหน้าที่เข้าชมบนเว็บไซต์ของคุณ
วิธีกรองคำค้นหาใน Google Search Console
Google Search Console เป็นหนึ่งในเครื่องมือสำคัญเช่น Google Analytics โดยให้ข้อมูลเกี่ยวกับวิธีที่ Google ใช้หน้าในผลการค้นหา วิเคราะห์ปัญหาในแง่ของ SEO ด้านเทคนิค และเพิ่มมูลค่าในการรับข้อมูลที่เกี่ยวข้องกับพฤติกรรมของผู้ใช้
เมื่อเร็วๆ นี้ Google Search Console ได้เพิ่มฟีเจอร์ “Regex” ในเดือนเมษายน 2021 เพื่อปรับปรุงการกรองข้อมูลในระดับสูง คุณสามารถกรองหารูปแบบที่:,
- จับคู่ Regex
- ไม่ตรงกับ Regex
มีสิ่งอำนวยความสะดวกมากมายที่ GSC นำเสนอ รวมถึงรายงานประสิทธิภาพที่โดดเด่น ที่นี่เราสามารถหาข้อมูลเช่น:
- จำนวนคลิกทั้งหมด
- การแสดงผลทั้งหมด
- CTR เฉลี่ย
- ตำแหน่งเฉลี่ย
- แบบสอบถาม (คำหลักถึง 1,000)
- เพจที่ติดอันดับ
- ประเทศ
- อุปกรณ์
- ลักษณะที่ปรากฏของการค้นหา
- วันที่
ที่ด้านบนสุดของรายงาน มีตัวเลือกการกรอง ในการใช้ Regex คุณต้องคลิกที่ตัวเลือก “+ใหม่”
คุณใช้ Regex เพื่อกรองคำค้นหา เพจ ประเทศ อุปกรณ์ และลักษณะที่ปรากฏของการค้นหา
นี่คือตัวอย่างพื้นฐานของการกรองวลี "หน่วยงานดิจิทัล" "หน่วยงานดิจิทัล" หรือวลีที่มีข้อความอื่นระหว่างดิจิทัลและหน่วยงาน (เช่น "หน่วยงานด้านการสื่อสารดิจิทัล" และ "ความเชี่ยวชาญด้านดิจิทัลของหน่วยงาน SEO คืออะไร") โดยใช้ Regex digital.+agency
:
นี่คือผลลัพธ์:
ทำไมต้องใช้ Regex?
แม้ว่าคุณจะต้องเรียนรู้แนวคิดของสตริงและโอเปอเรเตอร์ก่อน แต่ Regex สามารถเป็นเครื่องมือใหม่ที่มีประโยชน์สำหรับผู้ปฏิบัติงาน SEO หลายคน Regex สามารถช่วยในการระบุความตั้งใจในการค้นหา การวิเคราะห์เนื้อหา พฤติกรรมของผู้ใช้ ฯลฯ
อนาคตของ SEO ขึ้นอยู่กับข้อมูลและการทำความเข้าใจปัญหาทางเทคนิคโดยมีผลทันทีที่จำเป็นต้องแก้ไข
มีเครื่องมือมากมายที่ใช้การกรองข้อมูลเพื่อให้ข้อมูลเพิ่มเติมเกี่ยวกับเว็บไซต์ใดๆ ซึ่งอาจรวมถึง Ahrefs และ SEMrush และโปรแกรมรวบรวมข้อมูล เช่น Oncrawl แต่ยังรวมถึงเครื่องมือต่างๆ เช่น Google Analytics และ Google Search Console
เมื่อใช้ Regex จำเป็นต้องเข้าใจตัวดำเนินการและอักขระ จากนั้นวิธีการที่จะได้รับประโยชน์จากพวกเขาจะชัดเจน การใช้ตัวกรอง Regex จะช่วยให้เราเข้าใจข้อมูลที่มีอยู่เพื่อค้นหาความตั้งใจในการค้นหา และเน้นที่คำค้นหาที่นำผู้ใช้มาที่เว็บไซต์ของคุณ
ใช่ เป้าหมายของ SEO คือการได้รับปริมาณการใช้ข้อมูลและการจัดอันดับคำหลักอยู่ด้านบน แต่สิ่งสำคัญที่สุดคือการได้รับ Conversion และยอดขายเพิ่มขึ้น Regex สามารถช่วยคุณเปลี่ยนเว็บไซต์ของคุณให้เป็นเครื่องแปลงไฟล์