การเชื่อมโยงภายใน: วิธีการกำหนดหน้าที่สำคัญที่สุดที่จะเชื่อมโยง?

เผยแพร่แล้ว: 2021-05-03

หากลิงก์ภายนอก (ลิงก์ย้อนกลับ) เป็นหนึ่งในพื้นที่ของการปรับปรุงที่มักกล่าวถึงเพื่อปรับปรุง SEO ของคุณ การเชื่อมโยงภายในมักถูกมองข้าม แต่ก็มีความสำคัญเช่นกัน อันที่จริง โครงสร้างการเชื่อมโยงภายในที่ดีสามารถสร้างความแตกต่างในภาคส่วนที่มีการแข่งขันสูง

สำหรับไซต์ขนาดเล็ก การกำหนดหน้าที่สำคัญที่สุดในการเชื่อมโยงก่อนเป็นงานที่ค่อนข้างง่าย แล้วไซต์ที่มีหน้าหลายพันหรือหลายล้านหน้าล่ะ

ในบทความของวันนี้ ฉันจะอธิบายวิธีการที่คุณสามารถนำไปใช้กับโครงการของคุณเพื่อกำหนดหน้าลำดับความสำคัญ

การวิเคราะห์ N-gram ของคำหลักของเรา

อันดับแรก เราต้องเข้าใจว่าคำหลักใดที่ใช้บ่อยที่สุดในการค้นหาผลิตภัณฑ์หรือบริการของเรา หากคุณเคยเปิดรายงาน Google Search Console คุณอาจสังเกตเห็นว่าโครงสร้างคำหลักจำนวนมากสามารถมีอยู่ได้ ตัวอย่างเช่น สำหรับการซื้อเที่ยวบินระหว่างสองเมืองที่แตกต่างกัน ลองใช้ Lyon และ Barcelona กัน การค้นหาอาจเป็น :

  • เที่ยวบินลียงบาร์เซโลนา
  • เที่ยวบินลียงบาร์เซโลนา
  • เที่ยวบินราคาถูก lyon barcelona
  • เป็นต้น

การมีโครงสร้างคำสำคัญประเภทนี้จำนวนมากไม่ได้เจาะจงสำหรับอุตสาหกรรมการท่องเที่ยว และคุณอาจมีสถานการณ์ที่คล้ายคลึงกันในอุตสาหกรรมของคุณเอง

อย่างไรก็ตาม จำเป็นต้องรู้ว่าโครงสร้างใดใช้มากที่สุด เพื่อให้สามารถดำเนินการวิเคราะห์ได้อย่างถูกต้อง เราจะทำสิ่งนี้ได้อย่างไร? เพียงทำการวิเคราะห์ n-gram (ลำดับของ N คำที่ใช้เป็นคีย์เวิร์ด) ของข้อมูล Google Search Console ของเราเอง

ก่อนที่จะอธิบายวิธีการทำเช่นนี้ ให้ฉันชี้แจงสิ่งหนึ่ง: ขออภัย ข้อมูล Google Search Console ไม่สมบูรณ์

[กรณีศึกษา] SEO เชิงธุรกิจช่วยเพิ่มทราฟฟิกและคอนเวอร์ชั่นได้อย่างไร

ด้วยกลยุทธ์ SEO ที่ประสบความสำเร็จซึ่งมุ่งเน้นไปที่การจัดการเนื้อหาที่ซ้ำกัน การปรับปรุงโครงสร้างเว็บไซต์ และการวิเคราะห์พฤติกรรมของ Googlebot ทำให้ carwow เติบโตขึ้นเป็นธุรกิจ ค้นพบวิธีแสดงผลลัพธ์ที่แท้จริงจากกลยุทธ์ SEO ตาม ROI ของธุรกิจ
อ่านกรณีศึกษา

ข้อจำกัด

ก่อนที่เราจะเริ่มการวิเคราะห์ เราจำเป็นต้องทราบว่าตัวชี้วัดที่แสดงโดยเครื่องมือเมื่อคุณรวมส่วนข้อมูล "คำค้นหา" จะแสดงเพียง 30-50% (ตัวเลขที่แน่นอนจะขึ้นอยู่กับเว็บไซต์ของคุณ) ของยอดรวมที่แสดงหากคุณรวม มิติข้อมูล "หน้า" เช่น

กล่าวอีกนัยหนึ่ง: เครื่องมือทนทุกข์ทรมานจากการสุ่มตัวอย่างมิติ ซึ่งหมายความว่าเมตริกที่แสดงผลโดย Google Search Console จะแตกต่างกันไปขึ้นอยู่กับสิ่งที่คุณกำลังวิเคราะห์ (ข้อความค้นหา หน้า …) ฉันควรชี้ให้เห็นว่าฉันได้รับข้อมูลนี้โดยใช้ API เช่น โดยการโต้ตอบกับข้อมูลทั้งหมดที่มี แทนที่จะผ่านอินเทอร์เฟซที่ทุกคนคุ้นเคย ซึ่งอนุญาตให้คุณวิเคราะห์องค์ประกอบได้สูงสุด 1,000 รายการเท่านั้น

หากคุณทำงานกับ Python คุณสามารถอ่านเอกสารทางการของ Google หรือใช้ไลบรารี่นี้ซึ่งจะช่วยคุณประหยัดเวลาได้มาก ฉันใช้มันเองเป็นประจำ

ดังที่กล่าวไว้ Google Search Console ยังคงละเอียดถี่ถ้วนกว่าเครื่องมือของบุคคลที่สามอื่น ๆ เช่น SEMrush, SEObserver, Ahrefs หรือ Sistrix เพื่อตั้งชื่อเฉพาะที่รู้จักกันดีที่สุด

วิธีการรับ n-grams ของคุณ

เพื่อให้ได้ n-grams คุณต้องทำตามขั้นตอนนี้:

ดาวน์โหลดข้อมูล Google Search Console ของคุณ

การดาวน์โหลดข้อมูลสำหรับประเภทธุรกิจเดียวเป็นสิ่งสำคัญ เนื่องจาก n-grams ของส่วน Flight และส่วน Train ในไซต์ของคุณอาจแตกต่างกัน หากคุณผสมข้อมูล คุณอาจได้รับ n-grams ที่ถูกต้องสำหรับประเภทธุรกิจที่มีการค้นหามากที่สุดเท่านั้น

หากไซต์ของคุณเป็นไซต์ใหม่หรือไม่ค่อยปรากฏในหน้าแรก เราขอแนะนำให้คุณใช้แหล่งข้อมูลเพิ่มเติม

ลบตัวแปร

ในบางกรณี คุณอาจต้องลบองค์ประกอบบางอย่างในคำหลักเหล่านี้ ตัวอย่างเช่น สมมติว่ารายการของฉันมีคำหลักเพียง 4 คำ:

  • เที่ยวบินปารีส โรม
  • เที่ยวบินราคาถูก ปารีส โรม
  • เที่ยวบินลียงบาร์เซโลนา
  • เที่ยวบินราคาถูก lyon barcelona

ฉันต้องการรับ n-grams ในรูปแบบของโครงสร้างที่มีตัวแปร ตัวอย่างเช่น ฉันต้องการเก็บไว้เพียง: เที่ยวบิน {{origin}} {{destination}} และ เที่ยวบินราคาถูก {{origin}} {{destination}} โดยไม่มีเมือง ในกรณีของคุณ คุณอาจต้องเปลี่ยนชื่อผลิตภัณฑ์ ขนาด ฯลฯ... ทั้งนี้ขึ้นอยู่กับอุตสาหกรรมของคุณ

คำนวณ n-grams และรับปริมาณการค้นหา

คุณสามารถใช้ระบบใดก็ได้ที่คุณต้องการ: ในกรณีของฉัน ฉันใช้ Python ซึ่งมีข้อดีคือใช้งานง่ายและสามารถจัดการปริมาณข้อมูลที่เรามีบนคอมพิวเตอร์ปกติได้ (โดยไม่ทำให้ระบบขัดข้อง)

 #นำเข้าห้องสมุด
คอลเลกชั่นนำเข้า
นำเข้า nltk
นำเข้า numpy เป็น np
นำเข้าแพนด้าเป็น pd

#สร้างรายการคำหลักที่ไม่ซ้ำ
list_of_keywords = รายงาน['query'].tolist()

#สร้างรายการคำที่มีอยู่ในคำหลักเหล่านี้
list_of_words_in_keywords = [x.split(" ") สำหรับ x ใน list_of_keywords]

#นับคนที่พบบ่อยที่สุด
นับ = collections.Counter()
สำหรับวลีใน list_of_words_in_keywords:
  counts.update(nltk.ngrams(วลี 1))
  counts.update(nltk.ngrams(วลี 2))

คุณยังสามารถใช้ฟังก์ชันดั้งเดิมของ Oncrawl เพื่อวิเคราะห์เนื้อหาของคุณและค้นพบ n-gram บางส่วนที่ไม่ปรากฏใน Google Search Console (ยัง)

จากนั้น คุณจะต้องดึงข้อมูลปริมาณการค้นหาสำหรับแต่ละโครงสร้างเหล่านี้ เพื่อให้ได้ตารางดังที่แสดงด้านล่าง ตารางนี้แสดงโครงสร้างทั่วไป: โครงสร้างที่มีจำนวนการแสดงผลสูงสุดสำหรับประเภทธุรกิจของเรา

แบบสอบถาม นับ ความประทับใจ
เที่ยวบิน {ต้นทาง} {ปลายทาง} 50 167000
เที่ยวบินราคาประหยัด {ต้นทาง} {ปลายทาง} 676 30000
ตั๋ว {ต้นทาง} {ปลายทาง} 300 97000

ทำได้ดีมากที่ผ่านเข้าสู่ขั้นตอนนี้ได้ ฉันสามารถบอกคุณได้ว่าต้องการทราบว่าเราจะใช้ข้อมูลนี้เพื่ออะไร คำตอบอยู่ในตอนต่อไป

[กรณีศึกษา] SEO เชิงธุรกิจช่วยเพิ่มทราฟฟิกและคอนเวอร์ชั่นได้อย่างไร

ด้วยกลยุทธ์ SEO ที่ประสบความสำเร็จซึ่งมุ่งเน้นไปที่การจัดการเนื้อหาที่ซ้ำกัน การปรับปรุงโครงสร้างเว็บไซต์ และการวิเคราะห์พฤติกรรมของ Googlebot ทำให้ carwow เติบโตขึ้นเป็นธุรกิจ ค้นพบวิธีแสดงผลลัพธ์ที่แท้จริงจากกลยุทธ์ SEO ตาม ROI ของธุรกิจ
อ่านกรณีศึกษา

กำลังแยกปริมาณการค้นหา

จำไว้ว่าเป้าหมายของเราคือการกำหนดหน้าที่สำคัญที่สุดที่จะเชื่อมโยงไปก่อน

เพื่อให้เข้าใจว่าหน้าใดมีโอกาสเข้าชมสูงสุด เราจำเป็นต้องเรียกข้อมูลปริมาณการค้นหาของโครงสร้างคำหลักทั่วไปต่างๆ สำหรับแต่ละหน้า เราจะพิจารณาเฉพาะปริมาณการค้นหาที่นี่เท่านั้น แนวคิดของ CTR จะมาในภายหลัง!

คุณเริ่มเข้าใจว่าขั้นตอนก่อนหน้านี้มีไว้เพื่ออะไร? เพื่อให้เกิดประสิทธิภาพ จำเป็นต้องใช้ API มีโซลูชันมากมายซึ่งส่วนใหญ่เป็นโซลูชันแบบชำระเงิน หากคุณใช้ DataForSEO การได้รับปริมาณคำหลัก 350,000 คำจะทำให้คุณเสียค่าใช้จ่ายน้อยกว่า 40 ยูโร ดังนั้นเราจึงไม่ได้พูดถึงการลงทุนที่สำคัญเช่นกัน

เมื่อสิ้นสุดขั้นตอนนี้ คุณจะมีไฟล์ที่มีปริมาณที่เป็นไปได้ต่อ URL นี่คือผลรวมของปริมาตรของ n-gram ที่พบบ่อยที่สุดซึ่งคำนวณในขั้นตอนก่อนหน้า

การรวมข้อมูล

ในขั้นตอนนี้ เห็นได้ชัดว่าเราไม่สามารถใช้ข้อมูลนี้เพื่อจัดลำดับความสำคัญของหน้าที่สำคัญที่สุดในเว็บไซต์ของเรา ทำไมจะไม่ล่ะ?

อย่าผสมปริมาณและปริมาณการใช้ข้อมูล!

ในบางกรณี แม้ว่าคุณจะอยู่ในอันดับแรก CTR ของคุณอาจยังต่ำอยู่ ซึ่งมักเกิดจากจำนวนโฆษณาและคุณลักษณะ SERP ที่แสดงโดย Google เหนือหน้าเว็บของคุณ นี่คือตัวอย่างในการสืบค้นสภาพอากาศที่องค์ประกอบแรกของ Google ดึงดูดความสนใจของผู้ใช้อย่างมากนานก่อนที่ผู้ใช้จะสามารถเข้าถึงผลลัพธ์ทั่วไปแรกได้

ข้อจำกัดของ n-grams

ความสำคัญของคำหลักหางยาวอาจแตกต่างกันไปตามภาค โครงสร้างที่จะไม่ถูกเก็บไว้ในขั้นตอนแรก (หรือถูกซ่อนไว้โดย Google Search Console) อย่างไรก็ตามอาจเป็นส่วนที่น่าสนใจของศักยภาพ เราจึงต้องรวมไว้ด้วย

ความสำคัญของแต่ละหน้า

ในฐานะผู้เชี่ยวชาญ SEO เป้าหมายของเราไม่ใช่เพื่อสร้างการเข้าชม แต่เพื่อสร้างยอดขายผ่านเครื่องมือค้นหา ดังนั้น หากทำได้ การวิเคราะห์นี้จึงเป็นสิ่งสำคัญด้วยข้อมูลจากฝ่ายขายของคุณ ตัวอย่างเช่น ข้อมูลเกี่ยวกับอัตรากำไรจากการขายสามารถช่วยคุณกำหนด URL ที่คุณควรจัดลำดับความสำคัญได้

มาดูตารางจากจุดสิ้นสุดของขั้นตอนก่อนหน้า และเพิ่มข้อมูลอื่นที่อาจเป็นประโยชน์ในการวัด:

  • โอกาสในการเปิดรับ (ปริมาณ / การแสดงผล)
  • การเข้าชมจริง (เซสชัน / คลิก)
  • รายได้ (อัตรา Conversion / ส่วนต่าง / รายได้)

นี่คือตัวอย่างวิธีการนำเสนอตารางนี้:

การถ่วงน้ำหนักข้อมูล

ในการจัดประเภทเนื้อหาแต่ละส่วนตามจำนวนผู้ที่เห็น การเข้าชมที่เป็นไปได้ และรายได้ คุณต้องตัดสินใจว่าจะให้น้ำหนักองค์ประกอบแต่ละองค์ประกอบเหล่านี้มากน้อยเพียงใด

ฉันไม่สามารถเสนอเปอร์เซ็นต์มาตรฐานได้ ขึ้นอยู่กับคุณที่จะกำหนดเปอร์เซ็นต์ที่เหมาะสมกับสถานการณ์ของคุณเอง

มาตรฐาน

โปรดทราบว่าเรายังไม่สามารถกำหนดความสำคัญของหน้าเว็บแต่ละหน้าได้ ผลลัพธ์ที่เราได้รับจากการชั่งน้ำหนักข้อมูลที่เราได้รับก่อนหน้านี้ยังไม่ถูกต้อง

คำอธิบาย: ตามคำจำกัดความ การแสดงผลจะสูงกว่าการคลิกและเซสชัน โดยเฉพาะอย่างยิ่งในอุตสาหกรรมที่มี CTR ต่ำ หากไม่มีการประมวลผลข้อมูลของเราล่วงหน้า เราเสี่ยงต่อ การแสดงผลที่มีน้ำหนักเกิน (และเซสชันที่มีน้ำหนักเกิน)

เราจะแก้ปัญหานี้อย่างไร? ด้วยการทำให้ข้อมูลของเราเป็นมาตรฐาน! กระบวนการนี้ช่วยให้เราสามารถปรับขนาดตัวแปรตัวเลขเพื่อให้เทียบได้กับมาตราส่วนทั่วไป (ซอร์ส) ด้วยการจัดการทางคณิตศาสตร์ การกระจายข้อมูลเชิงปริมาณของเราจะมีค่ากลางเป็น 0 และค่าเบี่ยงเบนมาตรฐานเท่ากับ 1

หากคุณอยากรู้สูตรทางคณิตศาสตร์มีดังนี้:

X_standard = ค่ามาตรฐาน
X = ค่าเริ่มต้น
μ = ค่าเฉลี่ย (ค่าเฉลี่ย) ของการกระจายของเรา
σ = ส่วนเบี่ยงเบนมาตรฐานของการแจกแจงของเรา

ง่ายมากที่จะใช้สูตรนี้กับข้อมูลของคุณ:

ใช้สูตรนี้กับข้อมูลทั้งหมดที่คุณต้องการพิจารณาในการคำนวณของคุณ วิธีนี้จะช่วยขจัดปัญหาเรื่องน้ำหนักเกินเมตริกได้อย่างแน่นอน

การคำนวณคะแนน

เมื่อคุณกำหนดน้ำหนักและคำนวณค่ามาตรฐานแล้ว คุณสามารถกำหนดคะแนนให้กับ URL แต่ละรายการของคุณเพื่อกำหนดความสำคัญของ URL ในตัวอย่างนี้ เรามี 4 เมตริก โดยแต่ละตัวมีน้ำหนักเท่ากันที่ 25% แต่คุณสามารถใช้ตัวเลขอื่นได้อย่างชัดเจน

ดังนั้น วิธีการนี้จึงทำให้คุณสามารถวาง URL ที่เหมาะสมที่สุดก่อนได้: ปริมาณการค้นหาที่ต่ำกว่า แต่มีการแสดงผลสูงและเหนือสิ่งอื่นใด CTR ที่น่าประทับใจ

ด้วยข้อมูลนี้ คุณจะสามารถกำหนดโครงสร้างการเชื่อมโยงภายในของคุณในลักษณะที่ครอบคลุมและมีความเกี่ยวข้องมากกว่าการใช้เกณฑ์เดียว เช่น ปริมาณการค้นหา ขึ้นอยู่กับคุณที่จะเชื่อมโยง:

  • จากหน้าแรก : หน้าที่สำคัญที่สุด
  • จากหมวดหมู่: หน้าที่สำคัญที่สุดของหมวดหมู่ที่เป็นปัญหา
  • และอื่นๆ.

บทสรุป

วิธีการของ n-gram นั้นมีประสิทธิภาพและมีข้อได้เปรียบที่สามารถนำไปประยุกต์ใช้กับหลาย ๆ โครงการได้ คุณเพียงแค่ต้องปรับตัวโดยใช้ข้อมูลที่สำคัญที่สุดในอุตสาหกรรมของคุณ แม้จะมีการใช้แนวคิดทางคณิตศาสตร์ที่อาจเป็นเรื่องใหม่สำหรับบางคน (การทำให้เป็นมาตรฐาน) แต่ก็สามารถอธิบายได้ง่ายและนำไปปฏิบัติด้วยเครื่องมือที่คุณมี

มันจะให้ข้อมูลที่จำเป็นแก่คุณเพื่อสร้างเครือข่ายภายในของคุณตามศักยภาพและผลลัพธ์ของเพจของคุณ งานที่ซับซ้อนในบางครั้งสำหรับไซต์ขนาดใหญ่

สิ่งที่คุณต้องทำคือใช้มัน!