เบรดครัมบ์ SEO, Python 3 และ Oncrawl: สู่การทำงานอัตโนมัติ!

เผยแพร่แล้ว: 2021-04-14

มาเรียนรู้วิธีสร้างการแบ่งกลุ่มตามเบรดครัมบ์โดยอัตโนมัติด้วย OnCrawl และ Python 3

การแบ่งส่วนใน Oncrawl คืออะไร?

Oncrawl ใช้การแบ่งกลุ่มเพื่อแบ่งชุดของเพจออกเป็นกลุ่ม ทำให้ง่ายต่อการวิเคราะห์ข้อมูลจากรายงานการรวบรวมข้อมูล การวิเคราะห์บันทึก และรายงานการวิเคราะห์ข้ามอื่นๆ ที่ผสมผสานข้อมูลการรวบรวมข้อมูลเข้ากับ Google Analytics, Google Search Console, AT Internet, Adobe Analytics หรือ Majestic สำหรับลิงก์ย้อนกลับ

เหตุใดการสร้างการแบ่งส่วนจึงมีความสำคัญ

เมื่อการรวบรวมข้อมูลของคุณเสร็จสิ้น การสร้างการแบ่งส่วนแบบกำหนดเองเป็นสิ่งสำคัญที่สุดที่ต้องทำ ซึ่งจะทำให้คุณสามารถอ่านบทวิเคราะห์จากมุมมองที่เหมาะสมกับไซต์และโครงสร้างของคุณได้ดีที่สุด

มีหลายวิธีในการแบ่งส่วนหน้าของไซต์ของคุณ และไม่มีวิธีที่ถูกหรือผิดที่จะทำ ตัวอย่างเช่น เป็นไปได้ที่จะติดตามโครงสร้างของไซต์ของคุณตามโครงสร้าง URL

ตัวอย่างเช่น URL ประเภทนี้ “ https://www.mydomain.com/news/canada/politics “ สามารถแบ่งกลุ่มได้ง่ายดังนี้:

  • กลุ่มแยกโฮมเพจ
  • กลุ่มสำหรับข่าวทั้งหมด
  • กลุ่มย่อยสำหรับไดเรกทอรีแคนาดา
  • กลุ่มย่อยสำหรับไดเรกทอรีการเมือง

อย่างที่คุณเห็น คุณสามารถสร้างความลึกได้ถึง 3 ระดับสำหรับการแบ่งกลุ่มของคุณ วิธีนี้ช่วยให้คุณมุ่งเน้นไปที่กลุ่มหรือกลุ่มย่อยบางกลุ่มในการวิเคราะห์ SEO ของคุณ โดยไม่ต้องเปลี่ยนการแบ่งกลุ่ม

ฉันจะสร้างการแบ่งส่วนพื้นฐานได้อย่างไร

คุณควรรู้ว่า Oncrawl ดูแลการสร้างการแบ่งส่วนแรกทั้งหมดด้วยตัวเอง ขึ้นอยู่กับ "เส้นทางแรก" หรือไดเรกทอรีแรกที่พบใน URL
ซึ่งจะทำให้คุณมีการวิเคราะห์ทันทีที่การรวบรวมข้อมูลของคุณเสร็จสิ้น
อาจเป็นเพราะการแบ่งกลุ่มนี้ไม่ได้สะท้อนถึงโครงสร้างของไซต์ของคุณ หรือคุณต้องการวิเคราะห์สิ่งต่างๆ จากมุมที่ต่างออกไป
ดังนั้น คุณจะต้องสร้างการแบ่งกลุ่มใหม่โดยใช้สิ่งที่เราเรียกว่า OQL ซึ่งย่อมาจาก Oncrawl Query Language มันเหมือนกับ SQL ที่ง่ายกว่าและเข้าใจง่ายกว่ามาก:

นอกจากนี้ยังสามารถใช้ตัวดำเนินการเงื่อนไข AND/OR เพื่อให้แม่นยำที่สุดได้:

การแบ่งกลุ่มหน้าของฉันโดยใช้วิธีการต่างๆ

การใช้ KPI อื่นๆ

การแบ่งกลุ่มตาม URL นั้นดี แต่คงจะสมบูรณ์แบบถ้าเราสามารถรวม KPI อื่นๆ เข้าด้วยกันได้ เช่น การจัดกลุ่ม URL ที่ขึ้นต้นด้วย /car-rental/ และ H1 มีนิพจน์ว่า " หน่วยงานให้เช่ารถ " และอีกกลุ่มหนึ่งที่ H1 จะเป็น “ ตัวแทนให้เช่ายูทิลิตี้ ” เป็นไปได้ไหม?

ใช่ เป็นไปได้! ในระหว่างการสร้างการแบ่งเซ็กเมนต์ของคุณ คุณมี KPI ทั้งหมดที่เราใช้อยู่ และไม่เพียงแต่จากโปรแกรมรวบรวมข้อมูลเท่านั้น แต่ยังรวมถึง KPI จากตัวเชื่อมต่อด้วย สิ่งนี้ทำให้การสร้างการแบ่งส่วนมีประสิทธิภาพมากและช่วยให้คุณมีมุมการวิเคราะห์ที่แตกต่างกันโดยสิ้นเชิง!

ตัวอย่างเช่น ฉันชอบสร้างการแบ่งกลุ่มโดยใช้ตำแหน่งเฉลี่ยของ URL ด้วยตัวเชื่อมต่อ Google Search Console

ด้วยวิธีนี้ ฉันสามารถระบุ URL ที่อยู่ลึกในโครงสร้างของฉันที่ยังคงทำงานอยู่ หรือ URL ใกล้กับหน้าแรกของฉันที่อยู่ในหน้าที่ 2 ของ Google

ฉันสามารถดูได้ว่าหน้าเหล่านี้มีเนื้อหาที่ซ้ำกัน แท็กชื่อที่ว่างเปล่า หากได้รับลิงก์เพียงพอหรือไม่ ฉันสามารถดูว่า Googlebot ทำงานอย่างไรในหน้าเหล่านี้ ความถี่ในการรวบรวมข้อมูลดีหรือไม่ดี? โดยสรุป มันช่วยให้ฉันจัดลำดับความสำคัญและตัดสินใจได้ว่าจะมีผลกระทบอย่างแท้จริงต่อ SEO และ ROI ของฉัน

Oncrawl Data³

ขยายการวิเคราะห์ของคุณด้วยการเชื่อมต่อที่ราบรื่นไปยังชุดข้อมูลเพิ่มเติม วิเคราะห์กลยุทธ์ SEO ของคุณตามข้อมูลบนลิงก์ย้อนกลับ ปริมาณการใช้ SEO การจัดอันดับ และชุดข้อมูลที่กำหนดเองจาก CRM โซลูชันการตรวจสอบ หรือแหล่งอื่นๆ
เรียนรู้เพิ่มเติม

การใช้ Data Ingest

หากคุณไม่คุ้นเคยกับคุณลักษณะ Data Ingest ของเรา ฉันขอเชิญคุณอ่านบทความนี้ในหัวข้อนี้ก่อน นี่เป็นอีกหนึ่งเครื่องมือที่ทรงพลังมากที่ให้คุณเพิ่มแหล่งข้อมูลภายนอกให้กับ Oncrawl
ตัวอย่างเช่น คุณสามารถเพิ่มข้อมูลจาก SEMrush, Ahrefs, Babbar.tech... ข้อดีคือคุณสามารถจัดกลุ่มหน้าเว็บของคุณตามเมตริกที่นำมาจากเครื่องมือเหล่านี้และดำเนินการวิเคราะห์ตามข้อมูลที่คุณสนใจ แม้ว่าจะไม่ใช่ โดยกำเนิดใน Oncrawl

เมื่อเร็ว ๆ นี้ ฉันทำงานกับกลุ่มโรงแรมระดับโลก พวกเขาใช้วิธีให้คะแนนภายในเพื่อดูว่าบันทึกข้อมูลโรงแรมถูกต้องหรือไม่ มีรูปภาพ วิดีโอ เนื้อหา ฯลฯ หรือไม่... พวกเขากำหนดเปอร์เซ็นต์ของความสำเร็จ ซึ่งเราใช้ในการวิเคราะห์ข้อมูลการรวบรวมข้อมูลและล็อกไฟล์

ผลลัพธ์ช่วยให้เราทราบว่า Googlebot ใช้เวลามากขึ้นกับหน้าที่กรอกอย่างถูกต้องหรือไม่ เพื่อดูว่าหน้าบางหน้าที่มีคะแนนมากกว่า 90% นั้นลึกเกินไป ไม่ได้รับลิงก์เพียงพอหรือไม่... ช่วยให้เราแสดงว่ายิ่งสูง คะแนน ยิ่งมีการเข้าชมหน้าเว็บมากเท่าไร Google ก็ยิ่งสำรวจหน้าเว็บมากขึ้นเท่านั้น และมีตำแหน่งที่ดีขึ้นใน Google SERP อาร์กิวเมนต์ที่หยุดไม่อยู่เพื่อสนับสนุนผู้ประกอบการโรงแรมให้กรอกรายชื่อโรงแรมของพวกเขา!

สร้างเซ็กเมนต์ตามเส้นทางเบรดครัมบ์ของ SEO

นี้เป็นหัวข้อของบทความนี้ดังนั้นให้ได้รับหัวใจของเรื่องนี้ ในบางครั้ง การแบ่งส่วนหน้าในไซต์ของคุณเป็นเรื่องยาก หากโครงสร้างของ URL ไม่ได้แนบหน้ากับไดเรกทอรีบางแห่ง กรณีนี้มักเกิดขึ้นกับไซต์อีคอมเมิร์ซ โดยที่หน้าผลิตภัณฑ์ทั้งหมดอยู่ที่รูท ดังนั้นจึงเป็นไปไม่ได้ที่จะทราบจาก URL ที่กลุ่มเพจเป็นของ
ในการจัดกลุ่มเพจเข้าด้วยกัน เราต้องหาวิธีระบุกลุ่มที่พวกเขาเป็นสมาชิก ดังนั้นเราจึงมีแนวคิดในการดึงเส้นทาง seo ของ breadcrumb ของแต่ละ URL และจัดหมวดหมู่ตามค่าใน breadcrumbs seo โดยใช้ฟังก์ชัน Scraper ที่ Oncrawl นำเสนอ

SEO Breadcrumb Scraping ด้วย Oncrawl

ดังที่เราเห็นข้างต้น เราจะตั้งกฎการขูดเพื่อดึงเส้นทางการแสดงเส้นทาง ส่วนใหญ่มันค่อนข้างง่ายเพราะเราสามารถไปดึงข้อมูลใน div จากนั้นฟิลด์ของแต่ละระดับจะอยู่ใน
รายการ ul และ li :

บางครั้งเราสามารถดึงข้อมูลได้อย่างง่ายดายด้วย Breadcrumb ประเภทข้อมูลที่มีโครงสร้าง ดังนั้นจึงง่ายต่อการดึงค่าของฟิลด์ "ชื่อ" สำหรับแต่ละตำแหน่ง

นี่คือตัวอย่างกฎการขูดที่ฉันใช้:

หรือกฎนี้: //li[contains(@class, "current-menu-ancestor") or contains(@class, "current-menu-parent") or contains(@class, "current-menu-item")]/a/text()

ดังนั้นฉันจึงได้ span itemprop=”title” ทั้งหมดด้วย Xpath จากนั้นใช้นิพจน์ทั่วไปเพื่อแยกทุกอย่างหลัง “> นั่นไม่ใช่อักขระ > หากคุณต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับ Regex ฉันแนะนำให้คุณอ่านบทความนี้ในหัวข้อและเอกสารโกงของเราเกี่ยวกับ Regex

ฉันได้รับค่าหลายค่าเช่นนี้เป็นผลลัพธ์:

สำหรับ URL ที่ทดสอบ ฉันจะมีฟิลด์ "เบรดครัมบ์" ที่มีค่า 3 ค่า:

  • ผู้ชาย
  • เสื้อโปโล
  • โปโลแขนสั้น
 นำเข้า json
นำเข้าสุ่ม
คำขอนำเข้า

#ของแท้
# สองวิธีด้วย x-oncrawl-token มากกว่าที่คุณจะได้รับในส่วนหัวคำขอจากเบราว์เซอร์
# หรือด้วยโทเค็น api ที่นี่: https://app.oncrawl.com/account/tokens
API_ACCESS_TOKEN = ' '
# ตั้งค่ารหัสการรวบรวมข้อมูลที่มีฟิลด์ที่กำหนดเองของ breadcrumb
คลาน_
# อัปเดตรายการเบรดครัมบ์ต้องห้ามที่คุณไม่ต้องการแบ่งกลุ่ม
FORBIDDEN_BREADCRUMB_ITEMS = ('สะสม',)
FORBIDDEN_BREADCRUMB_ITEMS_LIST = [
                                 v.สตริป() 
                                 สำหรับ v ใน FORBIDDEN_BREADCRUMB_ITEMS.split(',')
                                 ]



def random_color():
    random_number = random.randint(0, 16777215)
    hex_number = str(เลขฐานสิบหก(random_number))
    hex_number = hex_number[2:].ljust(6, '0')
    คืนค่า f'#{hex_number}'


def value_to_group(ค่า):
    กลับ {
        'สี': random_color(),
        'ชื่อ': ค่า,
        'oql': {'or': [{'field': ['custom_Breadcrumb', 'equals', value]}]}
    }


def walk_dict(พจนานุกรม, ระดับ=0):
    ถอยหลัง = {
        "ไอคอน": "แดชบอร์ด",
        "transposable": เท็จ,
        "ชื่อ": "เกล็ดขนมปัง"
    }

เมื่อกำหนดกฎแล้ว ฉันสามารถเปิดการรวบรวมข้อมูลของฉัน และ Oncrawl จะดึงค่าเบรดครัมบ์โดยอัตโนมัติและเชื่อมโยงกับแต่ละ URL ที่รวบรวมข้อมูล

สร้างการแบ่งส่วนหลายระดับโดยอัตโนมัติด้วยPython

ตอนนี้ฉันมีค่าเบรดครัมบ์ SEO ทั้งหมดสำหรับแต่ละ URL เราจะใช้สคริปต์ seo automation python ใน Google Colab เพื่อสร้างการแบ่งส่วนโดยอัตโนมัติที่เข้ากันได้กับ Oncrawl

สำหรับตัวสคริปต์เอง เราใช้ 3 ไลบรารีซึ่งได้แก่:

  • json (เพื่อสร้างการแบ่งส่วนของเราที่เขียนใน Json)
  • csv
  • สุ่ม (เพื่อสร้างรหัสสีฐานสิบหกสำหรับแต่ละกลุ่ม)

เมื่อสคริปต์เปิดตัว สคริปต์จะดูแลการสร้างการแบ่งส่วนในโครงการของคุณโดยอัตโนมัติ!

การแสดงตัวอย่างข้อมูลในการวิเคราะห์

เมื่อสร้างการแบ่งกลุ่มแล้ว ก็สามารถเข้าถึงการวิเคราะห์ต่างๆ ด้วยมุมมองที่แบ่งกลุ่มตามเส้นทางการแสดงเส้นทางของฉัน

การกระจายหน้าตามกลุ่มและตามความลึก


ประสิทธิภาพการจัดอันดับ (GSC)


ความถี่ในการรวบรวมข้อมูลของ Googlebot


การเข้าชม SEO และอัตราส่วนหน้าที่ใช้งานอยู่


รหัสสถานะที่ผู้ใช้พบและเซสชัน SEO


การตรวจสอบรหัสสถานะที่พบโดย Googlebot


การกระจายของ Inrank

และนี่คือ เราเพิ่งสร้างการแบ่งส่วนโดยอัตโนมัติด้วยสคริปต์ที่ใช้ Python และ OnCrawl ตอนนี้ทุกหน้าถูกจัดกลุ่มตามเส้นทางการแสดงเส้นทาง และนี่คือ 3 ระดับความลึก:

ข้อดีคือตอนนี้เราสามารถติดตาม KPI ต่างๆ (การรวบรวมข้อมูล, ความลึก, ลิงก์ภายใน, งบประมาณการรวบรวมข้อมูล, เซสชัน SEO, การเข้าชม SEO, ประสิทธิภาพการจัดอันดับ, เวลาในการโหลด) สำหรับแต่ละกลุ่มและกลุ่มย่อยของหน้า

อนาคตของ SEO กับ Oncrawl

คุณอาจคิดว่าการมีความสามารถ "นอกกรอบ" นี้เป็นเรื่องดี แต่คุณไม่จำเป็นต้องมีเวลาทำทุกอย่าง ข่าวดีก็คือเรากำลังดำเนินการเพื่อรวมคุณลักษณะนี้โดยตรงในอนาคตอันใกล้นี้

ซึ่งหมายความว่าในไม่ช้าคุณจะสามารถสร้างการแบ่งกลุ่มโดยอัตโนมัติในฟิลด์ที่ทิ้งหรือฟิลด์จาก Data Ingest ด้วยการคลิกง่ายๆ และนั่นจะช่วยคุณประหยัดเวลาได้มาก ในขณะเดียวกันก็ช่วยให้คุณทำการวิเคราะห์ SEO แบบตัดขวางได้อย่างไม่น่าเชื่อ

ลองนึกภาพว่าสามารถดึงข้อมูลใดๆ จากซอร์สโค้ดของหน้าเว็บของคุณ หรือผสานรวม KPI สำหรับแต่ละ URL ขีด จำกัด เพียงอย่างเดียวคือจินตนาการของคุณ!

ตัวอย่างเช่น คุณสามารถดึงราคาขายของผลิตภัณฑ์ และดูความลึก Inrank ลิงก์ย้อนกลับ งบประมาณการรวบรวมข้อมูลตามราคา

แต่เรายังสามารถเรียกชื่อผู้เขียนบทความสื่อของคุณและดูว่าใครทำงานได้ดีที่สุดและใช้วิธีการเขียนที่ได้ผลดีที่สุด

เราสามารถเรียกข้อมูลรีวิวและการให้คะแนนผลิตภัณฑ์ของคุณ และดูว่าผลิตภัณฑ์ที่ดีที่สุดสามารถเข้าถึงได้โดยการคลิกขั้นต่ำ รับลิงก์เพียงพอ มีลิงก์ย้อนกลับ Googlebot รวบรวมข้อมูลอย่างดี ฯลฯ...

เราสามารถรวมข้อมูลธุรกิจของคุณ เช่น มูลค่าการซื้อขาย กำไร อัตราการแปลง ค่าใช้จ่าย Google Ads ของคุณ

ตอนนี้มันขึ้นอยู่กับคุณแล้วที่จะจินตนาการว่าคุณสามารถอ้างอิงโยงข้อมูลเพื่อขยายการวิเคราะห์และตัดสินใจ SEO ได้อย่างเหมาะสมได้อย่างไร

คุณต้องการทดสอบการแบ่งส่วนอัตโนมัติบนเส้นทางเบรดครัมบ์หรือไม่ ติดต่อเราผ่านช่องแชทโดยตรงจากภายใน Oncrawl

สนุกกับการรวบรวมข้อมูลของคุณ!

เริ่มการทดลองใช้ฟรีของคุณ