วิธีการทำงานของ Google: เรื่องราวของวิศวกรจัดอันดับของ Google #SMX

เผยแพร่แล้ว: 2022-06-12

Paul Haahr วิศวกรซอฟต์แวร์ของ Google ทำงานที่ Google มากว่า 14 ปี สำหรับสองคนนี้ เขาได้ร่วมสำนักงานกับ Matt Cutts เขากำลังเข้าสู่เวที SMX West 2016 เพื่อแชร์วิธีการทำงานของ Google จากมุมมองของวิศวกรของ Google หรืออย่างน้อยก็แชร์ให้มากที่สุดภายใน 30 นาที หลังจากนั้น นักวิเคราะห์เทรนด์ของผู้ดูแลเว็บ Gary Illyes จะเข้าร่วมบนเวทีกับเขา และทั้งสองจะตอบคำถามจากผู้ชม SMX โดยมี Danny Sullivan บรรณาธิการของ Search Engine Land กลั่นกรอง (ข้ามไปที่ส่วน Q&A!)

จากซ้าย: Gary Illyes นักวิเคราะห์แนวโน้มผู้ดูแลเว็บ Google, Paul Haahr วิศวกรซอฟต์แวร์ของ Google และ Danny Sullivan บรรณาธิการด้าน Search Engine Land บนเวที SMX West 2016 ในเมืองซานโฮเซ

Google ทำงานอย่างไร

Haahr เปิดตัวโดยบอกเราว่าวิศวกรของ Google ทำอะไร งานของพวกเขารวมถึง:

การเขียนโค้ดสำหรับการค้นหา
เมตริกการเพิ่มประสิทธิภาพ
มองหาสัญญาณใหม่
ผสานสัญญาณเก่าในรูปแบบใหม่
ย้ายผลงานด้วยเรตติ้งดีขึ้น
เลื่อนผลลัพธ์ด้วยเรตติ้งแย่ๆ ลง
แก้ไขแนวทางการให้คะแนน
การพัฒนาตัวชี้วัดใหม่เมื่อจำเป็น

สองส่วนของเครื่องมือค้นหา:

ล่วงหน้า (ก่อนการสอบถาม)
การประมวลผลแบบสอบถาม

ก่อนการสอบถาม

รวบรวมข้อมูลเว็บ
วิเคราะห์หน้าที่รวบรวมข้อมูล
- แยกลิงค์
- แสดงเนื้อหา
- อธิบายความหมาย
สร้างดัชนี

ดัชนี

เหมือนดัชนีของหนังสือ
สำหรับแต่ละคำ รายการของหน้าที่ปรากฏบน
แบ่งออกเป็นกลุ่มเพจนับล้าน
บวกเมตาดาต้าต่อเอกสาร

การประมวลผลคำค้นหา

แบบสอบถามความเข้าใจและการขยาย
แบบสอบถามตั้งชื่อหน่วยงานที่รู้จักหรือไม่
การดึงและการให้คะแนน
- ส่งแบบสอบถามไปยังชาร์ดทั้งหมด
  เศษแต่ละส่วน
  - ค้นหาหน้าที่ตรงกัน
  - คำนวณคะแนนสำหรับคำค้นหา+เพจ
  - ส่งกลับหน้า N ด้านบนด้วยคะแนน
- รวมทุกหน้าบนสุด
- เรียงตามคะแนน
การปรับภายหลังการดึงข้อมูล
- โฮสต์คลัสเตอร์
- มีการซ้ำซ้อน

สัญญาณการให้คะแนน

สัญญาณคือ:

ข้อมูลที่ใช้ในการให้คะแนน
แบบสอบถามอิสระ – คุณลักษณะของหน้า
ขึ้นอยู่กับคำค้นหา

ตัวชี้วัด

“ถ้าคุณไม่สามารถวัดได้ คุณก็ไม่สามารถปรับปรุงได้” - ลอร์ดเคลวิน

ความเกี่ยวข้อง
- หน้าตอบคำถามของผู้ใช้อย่างมีประโยชน์หรือไม่
- ตัวชี้วัดระดับบนสุดของการจัดอันดับ
คุณภาพ
- ผลลัพธ์ที่เราแสดงออกมาดีแค่ไหน
เวลามีผล (เร็วกว่าดีกว่า)

Google วัดตัวเองด้วยการทดลองสด:

การทดสอบ A/B กับการเข้าชมจริง
มองหาการเปลี่ยนแปลงในรูปแบบการคลิก
มีการเข้าชมจำนวนมากอยู่ในการทดสอบเดียวหรืออีกการทดสอบหนึ่ง

ในคราวเดียว Google ได้ทดสอบ 41 บลูส์ที่แตกต่างกันเพื่อดูว่าอันไหนดีที่สุด

Google ยังทำการทดลองผู้ประเมินโดยมนุษย์:

แสดงผลการค้นหาทดลองคนจริง
ถามว่าผลลัพธ์เป็นอย่างไร
การให้คะแนนโดยรวมของผู้ให้คะแนน
เผยแพร่แนวทางอธิบายเกณฑ์สำหรับผู้ประเมิน
เครื่องมือสนับสนุนการทำเช่นนี้ในลักษณะอัตโนมัติ คล้ายกับเครื่องกล Turk

Google ตัดสินหน้าเว็บด้วยสองปัจจัยหลัก:

Needs Met (โดยที่อุปกรณ์เคลื่อนที่อยู่ด้านหน้าและตรงกลาง)
คุณภาพของหน้า

ความต้องการตรงตามเกรด:

ตอบสนองอย่างเต็มที่
ตรงมาก
ตรงสุดๆ
ตรงพอประมาณ
เจอกันเล็กน้อย
ล้มเหลวในการพบปะ

แนวคิดเกี่ยวกับคุณภาพของหน้า:

ความ เชี่ยวชาญ พิเศษ
ความมี คุณธรรม
ความ น่า เชื่อถือ

กระบวนการพัฒนาวิศวกรของ Google:

ความคิด
ย้ำจนกว่าจะพร้อม
- เขียนโค้ด
- สร้างข้อมูล
- ทำการทดลอง
- วิเคราะห์
เปิดตัวรายงานโดยนักวิเคราะห์เชิงปริมาณ
เปิดตัวรีวิว
ปล่อย

เกิดอะไรขึ้น?

ปัญหามีสองประเภท:

เรตติ้งแย่อย่างเป็นระบบ
ตัวชี้วัดไม่ได้จับสิ่งที่เราสนใจ

นี่คือตัวอย่างการให้คะแนนที่ไม่ดี มีผู้ค้นหา [ปุ๋ยฟาร์มเท็กซัส] และผลการค้นหาจะแสดงแผนที่ไปยังสำนักงานใหญ่ของผู้ผลิต ไม่น่าเป็นไปได้มากที่นั่นคือสิ่งที่พวกเขาต้องการ Google กำหนดสิ่งนี้ผ่านการทดลองสด หากผู้ประเมินเห็นแผนที่และให้คะแนนว่าเป็นไปตามความต้องการ "ตรงมาก" แสดงว่านี่คือความล้มเหลว ณ จุดของการให้คะแนน

หรือจะเกิดอะไรขึ้นถ้าเมตริกหายไป? ในปี 2552-2554 มีการร้องเรียนมากมายเกี่ยวกับเนื้อหาคุณภาพต่ำ แต่ตัวชี้วัดความเกี่ยวข้องยังคงเพิ่มขึ้น เนื่องจากฟาร์มเนื้อหา สรุป: Google ไม่ได้วัดผลเมตริกที่จำเป็น ดังนั้น เมตริกคุณภาพจึงได้รับการพัฒนา นอกเหนือ จากความเกี่ยวข้อง

นี่คือสไลด์เดอร์ของ Paul Haahr ซึ่งควรค่าแก่การดู:
อัปเดต 7/19: การนำเสนอถูกทำเครื่องหมายเป็นส่วนตัวโดยผู้เขียนแล้ว

วิธีการทำงานของ Google: มุมมองของวิศวกรจัดอันดับ โดย Paul Haahr จากงาน Search Marketing Expo – SMX

Gary Illyes และ Paul Haahr ตอบคำถามจากผู้ชม SMX

SMX: RankBrain เข้ากับเรื่องทั้งหมดนี้ได้อย่างไร?

Haahr: RankBrain จะได้เห็นส่วนย่อยของสัญญาณ ฉันไม่สามารถลงรายละเอียดมากเกินไปเกี่ยวกับวิธีการทำงานของ RankBrain เราเข้าใจวิธีการทำงานแต่ไม่มากเท่ากับที่มันทำ ใช้เนื้อหามากมายที่เราเผยแพร่เกี่ยวกับการเรียนรู้เชิงลึก

RankBrain จะรู้จักอำนาจของเพจได้อย่างไร?

Haahr: ทั้งหมดนี้เป็นหน้าที่ของการฝึกที่ได้รับ มันเห็นข้อความค้นหาและสัญญาณอื่นๆ ฉันไม่สามารถพูดได้มากว่าจะเป็นประโยชน์

SMX: เมื่อคุณลงชื่อเข้าใช้แอป Google คุณแยกความแตกต่างจากข้อมูลที่รวบรวมหรือไม่ หากคุณใช้ Google Now กับ Chrome จะส่งผลต่อสิ่งที่คุณเห็นไหม

Haahr: เป็นคำถามจริงๆ ว่าคุณเข้าสู่ระบบหรือไม่ เรามอบประสบการณ์ที่สม่ำเสมอ ประวัติการเข้าชมของคุณติดตามคุณไปอย่างใดอย่างหนึ่ง

Google ให้ผลลัพธ์ที่แตกต่างกันสำหรับข้อความค้นหาเดียวกันในเวลาที่ต่างกันในหนึ่งวันหรือไม่

อิลเยส: ฉันไม่แน่ใจ ในแผนที่ ตัวอย่างเช่น หากเราแสดงบางอย่างที่เกี่ยวข้องกับแผนที่ เราจะแสดงเวลาทำการ มันไม่ได้เปลี่ยนสิ่งที่ปรากฏ เป็นความรู้ของแกรี่

SMX: เกิดอะไรขึ้นกับแพนด้าและเพนกวิน

Illyes: ฉันยอมแพ้ที่จะให้วันที่หรือไทม์ไลน์กับเพนกวิน เรากำลังดำเนินการอยู่ กำลังคิดหาวิธีเปิดตัว แต่จริงๆ แล้วฉันไม่รู้วันที่และฉันไม่ต้องการที่จะบอกวันที่เพราะฉันผิดไปแล้วสามหรือสี่ครั้ง และมันก็ไม่เป็นผลดีกับธุรกิจ

SMX: Post-Google Authorship คุณกำลังติดตามผู้มีอำนาจอย่างไร

Haahr: ที่ นั่นฉันจะไม่ลงรายละเอียดใด ๆ สิ่งที่ฉันจะพูดคือผู้ประเมินจะต้องตรวจสอบหน้าที่พวกเขาเห็นด้วยตนเอง สิ่งที่เราวัดคือ: เราสามารถทำงานได้ดีในการแสดงผลลัพธ์ที่ผู้ประเมินคิดว่าเป็นหน่วยงานที่ดีหรือไม่

SMX: หมายความว่ามีการใช้อำนาจเป็นปัจจัยทางตรงหรือทางอ้อมหรือไม่?

Haahr: ฉันจะไม่พูดว่าใช่หรือไม่ มันซับซ้อนกว่านั้นมาก และฉันไม่สามารถให้คำตอบโดยตรงได้

SMX: เมื่อการประพันธ์ที่ชัดเจนสิ้นสุดลง Google ได้บอกให้มีทางสายย่อยต่อไป คุณควรจะรำคาญกับ rel=author ไหม?

Illyes: มีทีมอย่างน้อยหนึ่งทีมที่ยังคงมองหาการใช้แท็ก rel=author เพื่อประโยชน์ในการพัฒนาในอนาคต ถ้าฉันเป็น SEO ฉันจะยังคงทิ้งแท็กไว้ ไม่เจ็บที่จะมีมัน อย่างไรก็ตาม สำหรับหน้าใหม่ อาจไม่คุ้มค่าที่จะมี แม้ว่าเราอาจจะใช้มันเพื่อบางสิ่งในอนาคต

SMX: คุณกำลังอ่านอะไรอยู่ตอนนี้?

Haahr: ฉันอ่านวารสารศาสตร์และหนังสือน้อยมาก อย่างไรก็ตาม ฉันเพิ่งจบ “City on Fire” – เกี่ยวกับนิวยอร์กในช่วงทศวรรษ 70 มี 900 หน้าและฉันรู้สึกผิดหวังเมื่อมันจบลง ฉันเพิ่งเริ่มต้น “มันไม่เกิดขึ้นที่นี่”