การดึงข้อมูล

สมมติว่าคุณมีโมเดลที่ฝัง เมื่อพิจารณาจากผู้ใช้ คุณจะ ตัดสินใจเลือกรายการที่จะแนะนำ

เมื่อมีคำค้นหาหนึ่งๆ เมื่อแสดงโฆษณา คุณจะเริ่มต้นด้วยการทำอย่างใดอย่างหนึ่งต่อไปนี้

  • สำหรับโมเดลการแยกตัวประกอบเมทริกซ์ จะทราบการฝังการค้นหา (หรือผู้ใช้) แบบคงที่ และระบบก็สามารถค้นหาข้อมูลจาก เมทริกซ์ที่ฝังของผู้ใช้
  • สำหรับโมเดล DNN ระบบจะคำนวณการค้นหาที่ฝัง \(\psi(x)\) ในการแสดงผลโดยการเรียกใช้เครือข่ายบนเวกเตอร์ของฟีเจอร์ \(x\)

เมื่อคุณฝังการค้นหา \(q\)แล้ว ให้ค้นหาการฝังรายการ \(V_j\) ที่อยู่ใกล้กับ \(q\) ในพื้นที่ที่ฝัง นี่คือปัญหาจากเพื่อนบ้านที่ใกล้ที่สุด เช่น อาจแสดงผล k ด้านบน รายการตามคะแนนความคล้ายคลึงกัน \(s(q, V_j)\)

รูปภาพสเปกตรัม 2 มิติที่มีภาพยนตร์หลายเรื่องและจัดเรียงผู้ใช้ไว้
ตั้งแต่ภาพยนตร์สำหรับเด็กไปจนถึงภาพยนตร์ผู้ใหญ่
นับตั้งแต่ภาพยนตร์ไปจนถึงภาพยนตร์ฟอร์มยักษ์ ผู้ใช้ 1 รายคือ
รวมถึงภาพยนตร์ใกล้เคียง 2 เรื่อง

คุณใช้วิธีที่คล้ายกันในการแนะนำรายการที่เกี่ยวข้องได้ ตัวอย่างเช่น เมื่อผู้ใช้ดูวิดีโอ YouTube ระบบจะสามารถค้นหา การฝังรายการนั้น แล้วมองหาการฝังรายการอื่นๆ \(V_j\) ที่อยู่ใกล้ในพื้นที่ที่ฝัง

การดึงข้อมูลจำนวนมาก

ในการคำนวณเพื่อนบ้านที่ใกล้ที่สุดในพื้นที่ที่ฝัง ระบบ สามารถให้คะแนนผู้สมัครทุกคนได้อย่างครบถ้วน ทำคะแนนได้เหนื่อยสุดๆ อาจมีราคาแพงสำหรับคลังข้อมูลขนาดใหญ่ แต่คุณสามารถใช้ กลยุทธ์ต่อไปนี้เพื่อเพิ่มประสิทธิภาพให้มากยิ่งขึ้น

  • หากการฝังการค้นหาเป็นที่รู้จักในเชิงสถิติ ระบบจะดำเนินการ ทำคะแนนแบบออฟไลน์อย่างละเอียด คำนวณล่วงหน้า และจัดเก็บรายการ คำที่เป็นตัวเลือกยอดนิยมสำหรับคำค้นหาแต่ละคำ ซึ่งเป็นแนวทางปฏิบัติทั่วไปสำหรับ คำแนะนำรายการที่เกี่ยวข้อง
  • ใช้เพื่อนบ้านที่อยู่ใกล้ที่สุด