วิธีเริ่มต้นกับ Regex

เผยแพร่แล้ว: 2021-07-21

Regex เป็นหนึ่งในทักษะทางเทคนิคที่มักถูกมองข้ามในด้านการตลาด สามารถใช้ใน Google Search Console, Google Analytics และ Google Data Studio สำหรับการดึงข้อมูลสำหรับ SEO

บทความนี้เน้นที่แนวคิดของ Regex อย่างสมบูรณ์ และความได้เปรียบในการใช้ประโยชน์จากการวิเคราะห์ข้อมูลโดยเป็นส่วนหนึ่งของบริการ SEO

วิทยาศาสตร์ข้อมูลและการวิเคราะห์ข้อมูลมีบทบาทสำคัญในอนาคตของ Search Engine Optimization ในทางปฏิบัติในปัจจุบัน เราไม่สามารถพึ่งพา On-Page, Off Page และ Technical SEO ได้เท่านั้น

Data SEO มีบทบาทอย่างมากในการได้ผลลัพธ์ที่ต้องการจากการจัดอันดับคำหลักและการเข้าชมแบบออร์แกนิก

Regex ช่วยในการแยกรูปแบบเฉพาะของอักขระจากชุดข้อมูลซึ่งเป็นทักษะที่สำคัญมากสำหรับนักแสดงหลายคนในพื้นที่ SEO:

  • ผู้เชี่ยวชาญด้าน SEO
  • ผู้ดูแลเว็บและทีมวิเคราะห์เว็บ
  • นักวิจัย/วิศวกรข้อมูล
  • ผู้เชี่ยวชาญด้านการตลาดดิจิทัล/ที่ปรึกษา

Regex คืออะไร?

Regex หรือที่เรียกกันทั่วไปว่า Regular Expressions เป็นหนึ่งในเครื่องมือที่ใช้สำหรับการจับคู่รูปแบบ Regex คือสตริงหรือชุดอักขระที่แสดงรูปแบบเพื่อจับคู่ จัดการ และกรองข้อความ

สตริง Regex อาจมีลักษณะดังนี้:
([0-9]+(\.[0-9]*)?)
ใช้ชุดอักขระ สัญลักษณ์ และองค์ประกอบอื่นๆ เพื่ออธิบายรูปแบบ รูปแบบอาจเป็นหมายเลขโทรศัพท์ URL วันที่หรือเวลา ที่อยู่ ตัวระบุ เช่น ข้อมูลอ้างอิงผลิตภัณฑ์ หรือแม้แต่ประโยคข้อความภายในหน้าโค้ด

จากนั้นคุณจะพบลำดับในข้อความหรือรายการที่ตรงกับรูปแบบที่คุณได้อธิบายไว้

[กรณีศึกษา] การปรับปรุงการจัดอันดับ การเข้าชมแบบออร์แกนิก และการขายด้วยการวิเคราะห์ไฟล์บันทึก

ในช่วงต้นปี 2017 ทีมงานของ TutorFair.com ได้ขอให้ Omi Sido 'บริการ SEO ช่วยเหลือพวกเขา เว็บไซต์ของพวกเขากำลังดิ้นรนกับการจัดอันดับและการเข้าชมแบบออร์แกนิก
อ่านกรณีศึกษา

Regex ใช้ใน SEO อย่างไร

ในแนวทางปฏิบัติของ SEO จะช่วยในการกรองคำหลักหรือวลีที่เว็บไซต์ได้รับการเข้าชม ในทางกลับกัน ตัวกรองนี้จะช่วยในการวิเคราะห์พฤติกรรมและความตั้งใจในการค้นหาของผู้ใช้ของคุณ สิ่งนี้มีความสำคัญมากขึ้นเรื่อยๆ นับตั้งแต่การอัปเดต BERT ของ Google Search Engine ซึ่งช่วยให้ Google ระบุความตั้งใจของผู้ใช้ได้ดีขึ้นโดยใช้ NLP

หลังจากนี้เสิร์ชเอ็นจิ้นมุ่งเน้นไปที่การทำความเข้าใจเจตนาของผู้ใช้และจัดอันดับเนื้อหาที่น่าสนใจที่สุดในหน้าแรกของ SERP Google Analytics และ Google Search Console เป็นเครื่องมือฟรีที่ใช้กันอย่างแพร่หลายใน SEO ที่สนับสนุนการใช้เทคโนโลยี Regex

ทักษะ Regex พื้นฐาน: Operators

ก่อนดำเนินการต่อไป คุณต้องเข้าใจตัวดำเนินการเพื่อใช้ Regex อย่างมีประสิทธิภาพ ตัวดำเนินการ Regex แบ่งออกเป็นห้าประเภท:

  1. ชุดอักขระ
  2. ไวด์การ์ด
  3. สมอ
  4. กลุ่ม
  5. ตัวละครหนี

ตัวดำเนินการแต่ละตัวแสดงถึงประเภทของอักขระหรือคำสั่ง นี่คือโอเปอเรเตอร์หลักบางส่วน

คลาสตัวละคร

คลาสอักขระคือชุดหรือประเภทของอักขระ

  • \d - ตรงกับตัวเลขใดหลักหนึ่ง
  • \D – ตรงกับอักขระตัวใดตัวหนึ่งที่ไม่ใช่ตัวเลข
  • \w - จับคู่ "อักขระคำ" ใด ๆ (ตัวอักษร ตัวเลข ขีดล่าง)
  • \s – ตรงกับช่องว่างใดๆ (ช่องว่าง แท็บ …)
  • \S – ตรงกับอักขระใดๆ ที่ไม่ใช่ช่องว่าง
  • ?-i – ระบุการจับคู่แบบตรงตามตัวพิมพ์เล็กสำหรับอักขระต่อไปนี้ทั้งหมด

ไวด์การ์ด

สัญลักษณ์แทนไม่ได้ระบุอักขระเฉพาะที่ตรงกัน

  • จุด (.) – ตรงกับอักขระตัวเดียว (ตัวอักษร ตัวเลข หรือสัญลักษณ์)
  • เครื่องหมายคำถาม (?) – ตรงกับอักขระก่อนหน้า 0 หรือ 1 ครั้ง
  • เครื่องหมายบวก (+) – ช่วยจับคู่อักขระก่อนหน้า 1 ครั้งขึ้นไป
  • เครื่องหมายดอกจัน (*) – ช่วยจับคู่อักขระก่อนหน้า 0 ครั้งขึ้นไป
  • ไปป์ (|) – สร้างการจับคู่ OR

สมอ

จุดยึดอธิบายส่วนของรูปแบบที่คุณพยายามจะจับคู่

  • Caret (^) – บ่งชี้ว่า Regex ควรจับคู่อักขระที่จุดเริ่มต้นของสตริงหรือบรรทัด แทนที่จะเป็นที่ใดก็ได้ในสตริง
  • เครื่องหมายดอลลาร์ ($) – ระบุว่า Regex ควรตรงกับอักขระที่ส่วนท้ายของสตริงหรือบรรทัด แทนที่จะเป็นที่ใดก็ได้ในสตริง

กลุ่ม

Groups คือวิธีจัดกลุ่มองค์ประกอบใน Regex

  • วงเล็บ (()) – มัน "จับ" อักขระที่อยู่ในวงเล็บซึ่งอาจอธิบายได้ด้วยรูปแบบรอบตัวพวกเขา ซึ่งจับคู่กับ Regex ที่เหลือ คุณสามารถใช้กลุ่มการจับภาพได้หลายกลุ่ม และจะถูกระบุตามลำดับที่ปรากฏ
  • วงเล็บเหลี่ยม ([]) – จับคู่ชุดอักขระที่ล้อมรอบในลำดับใดก็ได้ ที่ใดก็ได้ในสตริง
  • เส้นประ (-) – ใช้ภายในวงเล็บเหลี่ยมเพื่อระบุช่วงของอักขระ เช่น 0-9 หรือ AZ

หนี

อักขระหลีกช่วยให้คุณใช้อักขระได้อย่างแท้จริง แม้ว่าโดยปกติแล้วจะตีความว่าเป็นตัวดำเนินการก็ตาม

  • แบ็กสแลช (\) – ระบุว่าควรตีความอักขระที่อยู่ติดกันตามตัวอักษร แทนที่จะเป็นโอเปอเรเตอร์ Regex

ตอนนี้ มาดูตัวอย่างพื้นฐานสองสามอย่างเกี่ยวกับวิธีการใช้ใน Google Analytics และ Google Search Console

วิธีกรองตารางใน Google Analytics

Google Analytics เป็นหนึ่งในเครื่องมือฟรีที่ช่วยในการวิเคราะห์เส้นทางของผู้ใช้บนเว็บไซต์ของคุณด้วยความช่วยเหลือของข้อมูล ซึ่งรวมถึง:

  • ผู้ชม: ข้อมูลประชากร
  • การได้มา: ผู้ใช้มาถึงไซต์ของคุณอย่างไร
  • พฤติกรรม: สิ่งที่ผู้ใช้ทำในเว็บไซต์ของคุณ
  • Conversion: ไม่ว่าผู้ใช้จะบรรลุเป้าหมายการขายหรือการตลาดที่คุณตั้งไว้สำหรับพวกเขาในไซต์ของคุณหรือไม่

เราสามารถใช้ Regex เพื่อกรองข้อมูลใน Google Analytics และทำความเข้าใจพฤติกรรมของผู้ใช้

ในภาพด้านบน Regex /ebooks/|/tools/ ถูกใช้เพื่อกรองสองหน้าจาก 1,000 หน้าบนเว็บไซต์โดยใช้ |(ไปป์) ซึ่งหมายถึง “หรือ” สตริงนี้สามารถอ่านได้ดังนี้: “ค้นหาเฉพาะหน้าที่มี /ebooks/ หรือ /tools/

ในทำนองเดียวกัน คุณสามารถใช้สตริงอื่นๆ ทั้งหมดเพื่อเป็นผู้เชี่ยวชาญในการแยกแยะพฤติกรรมของผู้ใช้และหน้าที่เข้าชมบนเว็บไซต์ของคุณ

วิธีกรองคำค้นหาใน Google Search Console

Google Search Console เป็นหนึ่งในเครื่องมือสำคัญเช่น Google Analytics โดยให้ข้อมูลเกี่ยวกับวิธีที่ Google ใช้หน้าในผลการค้นหา วิเคราะห์ปัญหาในแง่ของ SEO ด้านเทคนิค และเพิ่มมูลค่าในการรับข้อมูลที่เกี่ยวข้องกับพฤติกรรมของผู้ใช้

เมื่อเร็วๆ นี้ Google Search Console ได้เพิ่มฟีเจอร์ “Regex” ในเดือนเมษายน 2021 เพื่อปรับปรุงการกรองข้อมูลในระดับสูง คุณสามารถกรองหารูปแบบที่:,

  • จับคู่ Regex
  • ไม่ตรงกับ Regex

มีสิ่งอำนวยความสะดวกมากมายที่ GSC นำเสนอ รวมถึงรายงานประสิทธิภาพที่โดดเด่น ที่นี่เราสามารถหาข้อมูลเช่น:

  • จำนวนคลิกทั้งหมด
  • การแสดงผลทั้งหมด
  • CTR เฉลี่ย
  • ตำแหน่งเฉลี่ย
  • แบบสอบถาม (คำหลักถึง 1,000)
  • เพจที่ติดอันดับ
  • ประเทศ
  • อุปกรณ์
  • ลักษณะที่ปรากฏของการค้นหา
  • วันที่

ที่ด้านบนสุดของรายงาน มีตัวเลือกการกรอง ในการใช้ Regex คุณต้องคลิกที่ตัวเลือก “+ใหม่”

คุณใช้ Regex เพื่อกรองคำค้นหา เพจ ประเทศ อุปกรณ์ และลักษณะที่ปรากฏของการค้นหา

นี่คือตัวอย่างพื้นฐานของการกรองวลี "หน่วยงานดิจิทัล" "หน่วยงานดิจิทัล" หรือวลีที่มีข้อความอื่นระหว่างดิจิทัลและหน่วยงาน (เช่น "หน่วยงานด้านการสื่อสารดิจิทัล" และ "ความเชี่ยวชาญด้านดิจิทัลของหน่วยงาน SEO คืออะไร") โดยใช้ Regex digital.+agency :

นี่คือผลลัพธ์:

ทำไมต้องใช้ Regex?

แม้ว่าคุณจะต้องเรียนรู้แนวคิดของสตริงและโอเปอเรเตอร์ก่อน แต่ Regex สามารถเป็นเครื่องมือใหม่ที่มีประโยชน์สำหรับผู้ปฏิบัติงาน SEO หลายคน Regex สามารถช่วยในการระบุความตั้งใจในการค้นหา การวิเคราะห์เนื้อหา พฤติกรรมของผู้ใช้ ฯลฯ

อนาคตของ SEO ขึ้นอยู่กับข้อมูลและการทำความเข้าใจปัญหาทางเทคนิคโดยมีผลทันทีที่จำเป็นต้องแก้ไข

มีเครื่องมือมากมายที่ใช้การกรองข้อมูลเพื่อให้ข้อมูลเพิ่มเติมเกี่ยวกับเว็บไซต์ใดๆ ซึ่งอาจรวมถึง Ahrefs และ SEMrush และโปรแกรมรวบรวมข้อมูล เช่น Oncrawl แต่ยังรวมถึงเครื่องมือต่างๆ เช่น Google Analytics และ Google Search Console

เมื่อใช้ Regex จำเป็นต้องเข้าใจตัวดำเนินการและอักขระ จากนั้นวิธีการที่จะได้รับประโยชน์จากพวกเขาจะชัดเจน การใช้ตัวกรอง Regex จะช่วยให้เราเข้าใจข้อมูลที่มีอยู่เพื่อค้นหาความตั้งใจในการค้นหา และเน้นที่คำค้นหาที่นำผู้ใช้มาที่เว็บไซต์ของคุณ

ใช่ เป้าหมายของ SEO คือการได้รับปริมาณการใช้ข้อมูลและการจัดอันดับคำหลักอยู่ด้านบน แต่สิ่งสำคัญที่สุดคือการได้รับ Conversion และยอดขายเพิ่มขึ้น Regex สามารถช่วยคุณเปลี่ยนเว็บไซต์ของคุณให้เป็นเครื่องแปลงไฟล์