เครื่องมือค้นหาถือเป็นเว็บไซต์ยอดนิยมบนอินเทอร์เน็ต ไม่น่าแปลกใจเพราะหากต้องการค้นหาบางสิ่งบนอินเทอร์เน็ตคุณต้องใช้บริการค้นหาก่อน
มีค่อนข้างมากและแม้แต่ผู้ใช้อินเทอร์เน็ตที่ไม่มีประสบการณ์ก็รู้จักเครื่องมือค้นหาอย่างน้อย 2-3 รายการ
มีเครื่องมือค้นหาอะไรบ้าง? บางคนรู้เกี่ยวกับเครื่องมือค้นหาหนึ่งรายการ บางคนรู้เกี่ยวกับบริการค้นหา 10 รายการ แต่ในความเป็นจริงแล้วยังมีอีกมากมาย
แน่นอนว่าความนิยมนั้นแตกต่างกันไป เช่นเดียวกับอินเทอร์เฟซและคุณภาพของผลลัพธ์ เราจะนำเสนอรายการจากเครื่องมือค้นหาต่างๆ เพื่อให้คุณสามารถเปรียบเทียบได้
เครื่องมือค้นหายอดนิยม
บริการค้นหาได้รับการพัฒนาสำหรับคนประเภทต่างๆ โปรแกรมที่มีชื่อเสียงที่สุดครอบคลุมประเทศต่างๆ หรือแม้แต่ทั่วโลก ในขณะที่โปรแกรมที่ไม่ค่อยมีคนรู้จักนั้นออกแบบมาสำหรับภูมิภาคหรือความสนใจของผู้ใช้
ด้านล่างนี้คือ 10 เสิร์ชเอ็นจิ้นที่คุณควรรู้:
- – ทุกคนรู้เกี่ยวกับเครื่องมือค้นหานี้ ซึ่งเป็นที่นิยมมากที่สุดในรัสเซียและมีฟังก์ชันการทำงานที่หลากหลายให้กับผู้ใช้ (ตั้งแต่การชำระเงินทางอิเล็กทรอนิกส์ไปจนถึงแผงควบคุมสำหรับผู้ดูแลเว็บ)
- – ผู้นำในบรรดาเว็บไซต์ทั้งหมดในโลก ถูกใช้โดยผู้คนจากทั่วทุกมุมโลกและถือเป็นเครื่องมือค้นหาคุณภาพสูงสุด เช่นเดียวกับ Yandex ลูกค้าจะได้รับเครื่องมือเพิ่มเติมมากมาย
- – ระบบการค้นหาและข้อมูลโดยคำนึงถึงสัณฐานวิทยาของภาษารัสเซีย ไซต์นี้มีเวอร์ชันแยกกันหลายเวอร์ชัน เช่น XRambler ซึ่งคุณสามารถค้นหาบริการต่างๆ ได้พร้อมกัน
- – ระบบนี้ได้รับความนิยมอย่างมากในต่างประเทศ ได้รับการแปลเป็นภาษารัสเซียเมื่อนานมาแล้ว แต่ก็ไม่เคยได้รับชื่อเสียงมากนักใน Runet ผู้ใช้สามารถเข้าถึงการค้นหาต่างๆ (โดยรูปภาพ วิดีโอ ฯลฯ)
- เป็นบริษัทที่มีชื่อเสียงใน Runet ซึ่งมีส่วนร่วมในการพัฒนาในหลายทิศทางในคราวเดียว นอกเหนือจากเครื่องมือค้นหาและบริการอีเมลยอดนิยมแล้ว พวกเขายังเป็นเจ้าของโครงการเช่น Odnoklassniki และ Vkontakte
- – ถูกสร้างขึ้นเพื่อเป็นทรัพยากรของรัฐในรัสเซีย แต่ไม่ได้รับการเผยแพร่จำนวนมาก คุณสามารถใช้รูปแบบการค้นหาต่าง ๆ และยังได้รับข้อมูลที่เป็นประโยชน์อีกด้วย
- – ออกแบบมาเพื่อค้นหาข้อมูลเกี่ยวกับกลุ่มอินเทอร์เน็ตของจีน ใครจะรู้บางทีนี่อาจเป็นประโยชน์กับคุณ คุณสามารถรับข่าวสาร ค้นหารูปภาพ เพลง รับแผนที่ และอื่นๆ อีกมากมาย
- เป็นโครงการของบริษัท Microsoft ที่มีชื่อเสียง ในแง่ของปริมาณการเข้าชม ไซต์นี้อยู่ในอันดับที่สองในการจัดอันดับเครื่องมือค้นหาของโลก เปิดให้บริการมาตั้งแต่ปี 1998 และได้รับการปรับปรุงให้ทันสมัยหลายครั้งในช่วงเวลานี้
- – บริการนี้เฉพาะชาวต่างชาติเท่านั้น โปรเจ็กต์นี้เป็นแบบอเมริกัน และนอกเหนือจากเครื่องมือค้นหาแล้ว บริษัทยังมีเว็บไซต์และบริการอื่นๆ อีกมากมาย เป็นที่น่าสังเกตว่าพวกเขามีแคตตาล็อกลิงก์ไปยังไซต์ต่างๆ บนเวิลด์ไวด์เว็บที่ใหญ่ที่สุด
หากคุณไม่พบข้อมูลในเครื่องมือค้นหาใดเครื่องมือค้นหาหนึ่ง ทำไมไม่ลองค้นหาผ่านไซต์อื่นล่ะ ตอนนี้คุณมีทรัพยากรที่มีคุณภาพมากมาย คุณจะพบกับสิ่งที่คุณต้องการอย่างแน่นอน
เราได้เปิดตัวหนังสือเล่มใหม่ การตลาดเนื้อหาโซเชียลมีเดีย: วิธีเข้าถึงหัวของผู้ติดตามของคุณ และทำให้พวกเขาตกหลุมรักแบรนด์ของคุณ
หากคุณเข้าใจบางสิ่งบางอย่างจริงๆก็ให้ละเอียดถี่ถ้วน และหากคุณสมัครรับข้อมูลบล็อกของเรา นั่นหมายความว่าคุณอาจต้องการเป็นผู้เชี่ยวชาญเจ๋งๆ หรือต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับการค้นหาบนอินเทอร์เน็ต เพื่อให้บรรลุสิ่งที่คุณต้องการ เคล็ดลับและเคล็ดลับชีวิตยังไม่เพียงพอ เราจำเป็นต้องขยายขอบเขตอันไกลโพ้นของเรา
เสิร์ชเอ็นจิ้นเป็นโปรแกรมขนาดใหญ่และซับซ้อนที่ออกแบบมาเพื่อค้นหาข้อมูลบนอินเทอร์เน็ต
คุณเคยสงสัยหรือไม่ว่าสิ่งที่เราใช้ทุกวันเกิดขึ้นได้อย่างไร มีสิ่งต่างๆ อะไรบ้างบนอินเทอร์เน็ต และทำไมสตูดิโอทั้งหมดจึงใช้งานได้เท่านั้น และ? คุณไม่ควรเก็บคำถามดังกล่าวไว้ชั่วคราว เพียง 10 นาที และนี่คืออีกหัวข้อสนทนาที่คุณสามารถสนับสนุนได้อย่างง่ายดาย
เครื่องมือค้นหาปรากฏอย่างไร
นานมาแล้ว เมื่ออินเทอร์เน็ตยังเป็นเด็กและเป็นสีเขียว...
ผู้ใช้ที่ต้องบอกว่ามีน้อยมากมีบุ๊กมาร์กของตัวเองเพียงพอ แต่สิ่งนี้อยู่ได้ไม่นาน: ในไม่ช้ามันก็กลายเป็นเรื่องยากสำหรับคน ๆ หนึ่งที่จะสำรวจความหลากหลายที่ปรากฏบนอินเทอร์เน็ตในเวลาอันสั้น
และเพื่อปรับปรุงความสับสนวุ่นวาย Yahoo, DMOZ และไดเร็กทอรีอื่น ๆ ได้ถูกประดิษฐ์ขึ้น (บางส่วนยังคงมีอยู่จนถึงทุกวันนี้) ซึ่งผู้เขียนได้เพิ่มและจัดเรียงไซต์ที่เกิดขึ้นใหม่เป็นหมวดหมู่ สักพักชีวิตก็ง่ายขึ้น
แต่อินเทอร์เน็ตยังคงขยายตัวอย่างต่อเนื่อง และในไม่ช้า ขนาดของแค็ตตาล็อกก็กลายเป็นสิ่งที่ใหญ่โตจนน่าเหลือเชื่อ จากนั้นนักพัฒนาก็คิดถึงการค้นหาภายในไดเร็กทอรีและจากนั้นก็สร้างระบบอัตโนมัติสำหรับจัดทำดัชนีทุกสิ่งที่อยู่บนอินเทอร์เน็ตเพื่อทำให้งานของผู้ใช้ทุกคนง่ายขึ้น
นี่คือลักษณะที่ปรากฏของโรบ็อตการค้นหาตัวแรก
เครื่องมือค้นหาใดเป็นอันดับแรก
เครื่องมือค้นหาแรกถือเป็นวันเด็กซ์ (สับสนกับยานเดกซ์!)แน่นอนว่าบริการในช่วงแรกๆ นี้และบริการอื่นๆ ยังห่างไกลจากความสมบูรณ์แบบ เมื่อตอบคำถามค้นหาพวกเขาส่งคืนสิ่งที่แตกต่างไปจากที่เราคุ้นเคยอย่างสิ้นเชิงนั่นคือ ไม่ใช่ที่สุดที่เกี่ยวข้อง หน้าและทุกอย่างติดต่อกันโดยไม่สนใจอันดับ เมื่อวันที่ 1 มกราคม พ.ศ. 2555 Wandex ได้เปิดตัวอีกครั้ง
นี่คือวิธีที่ PS แรกเริ่มทำงานมีเครื่องมือค้นหาอะไรบ้าง?บนอินเทอร์เน็ตสมัยใหม่? สิ่งที่แนบมาด้วยคือรายการ
มีเครื่องมือค้นหาประเภทใดบ้าง: ราชาแห่งฟลอร์เต้นรำ
น่าแปลกที่มีคนเถียงเครื่องมือค้นหาดีกว่าอย่างไร. ฉันจะไม่ทำเช่นนี้ เพียงเพราะมันแตกต่างกัน และโดยทั่วไปแล้วทุกอย่างขึ้นอยู่กับวัตถุประสงค์และประเภทผู้ใช้ของคุณ
ยานเดกซ์
นี่คือเครื่องมือค้นหายอดนิยมในประเทศของเรา LiveInternet อ้างว่ายานเดกซ์ ใช้ไป 50.9% ในขณะที่ Google คิดเป็น 40.6% (ข้อมูลจากเดือนมิถุนายน 2558)
มีตำนานที่ว่า Yandex มีคำขอเชิงพาณิชย์มากกว่าคู่แข่งที่ใกล้เคียงที่สุดหลายเท่า สองสามครั้งที่ฉันเจอความคิดที่ว่าต้องขอบคุณลัทธิภูมิภาคนิยมที่ได้รับการยกย่องในช่วงหลายปีที่ผ่านมา ประเภทของผู้ชมหรือจำนวนอาจแตกต่างกัน - นี่คือเหตุผลที่ทำให้ยานเดกซ์เป็นอันดับหนึ่งในการสืบค้นเชิงพาณิชย์ ดังนั้นอย่าไปเชื่อสิ่งนี้ พวกเขากำลังโกหก
เครื่องมือค้นหาของ Google ได้รับความนิยมมากที่สุดทุกที่ยกเว้นรัสเซีย :) มีความเป็นไปได้มากมายในทิศทางที่ต่างกัน โดยทั่วไปแล้วผู้นำระดับโลกที่ไม่มีปัญหาในหมู่โรบ็อตการค้นหา
Google เองก็ปรากฏตัวในช่วงเวลาเดียวกับยานเดกซ์และมาหาเราในรัสเซียในปี 2547 เท่านั้นเมื่อยานเดกซ์เสริมความแข็งแกร่งให้กับตำแหน่งของตน
กระบวนการค้นหาบน Google กลายเป็นคำที่คุ้นเคยสำหรับคนดินโลกหลายคนแล้ว แต่เมื่อฉันบอกแม่ว่า "Google" เธอก็ยังไปหาข้อมูลที่ต้องการในยานเดกซ์ :) เธอไม่รู้เลยเครื่องมือค้นหาใดบ้างที่มีอยู่บนอินเทอร์เน็ต
มีเครื่องมือค้นหาอะไรบ้าง: รายการเครื่องมือค้นหาที่ไม่ค่อยมีใครรู้จัก
ผู้ใช้อินเทอร์เน็ตส่วนใหญ่ไม่รู้ด้วยซ้ำมีเครื่องมือค้นหาอะไรบ้างนอกเหนือจาก Yandex?และกูเกิล พวกเขาอยู่นี่แล้ว ;) พบกับเรา!
ส่วนแบ่งการค้นหาของเสิร์ชเอ็นจิ้นนี้แทบจะเรียกได้ว่าไม่ใหญ่นัก แต่ตัวชี้วัดก็ค่อยๆเพิ่มขึ้น แม้ว่าคุณจะไม่ควรพลาดความจริงที่ว่าตัวเลขเหล่านี้ขึ้นอยู่กับอีเมล Odnoklassniki, Mail.ru และสิ่งอื่น ๆ จาก Mail Corporation โดยตรง
นี่คือโรงเรียนเก่าที่แท้จริง ลองนึกภาพ: เมื่อเครื่องมือค้นหานี้ปรากฏขึ้น SEO บางส่วนเพิ่งเรียนรู้ที่จะเดิน โดยทั่วไป Rambler มีโอกาสที่จะควบคุมการแสดง แต่สิ่งนี้ไม่ได้เกิดขึ้นด้วยเหตุผลหลายประการ ปัจจุบันนี้ไม่ใช่เสิร์ชเอ็นจิ้นอีกต่อไป แต่เป็นชุดบริการที่ใช้เครื่องมือค้นหายานเดกซ์ในการค้นหา - ตัวอย่างเช่นมี . อย่างไรก็ตาม ผู้เข้าร่วมค่อนข้างดี: มีผู้ใช้มากกว่าหนึ่งล้านคนเยี่ยมชมหน้าหลักของ Rambler ต่อวัน
Rambler มีเวอร์ชันด้วยแรมเบลอร์ Lite (เหมือนกันหมดเพียงแต่ไม่มีสภาพอากาศ ข่าวสาร โฆษณา และอื่นๆ) และเอ็กซ์รัมเบลอร์ ซึ่งรวมเครื่องมือค้นหา 15 รายการไว้ในคราวเดียว
เครื่องมือค้นหานี้เปลี่ยนชื่อไปกี่ชื่อแล้ว! ตลอดระยะเวลา 8 ปีที่ผ่านมา เขาพยายามลบล้างชื่อ MSN Search จากนั้น Windows Live Search จากนั้นย่อชื่อเดิมเป็น Live Search และตอนนี้เขาเปลี่ยนชื่อเป็น Bing แล้ว หลายคนแย้งว่าคุณภาพการค้นหาใกล้เคียงกับมาตรฐานของ Google
ตอนนี้เป็นการยากที่จะเรียก Yahoo ว่าเป็นเครื่องมือค้นหาเนื่องจากตามข้อตกลงไซต์ทั้งหมดที่ Yahoo เป็นเจ้าของใช้เครื่องมือค้นหา Bing สามารถดูข่าวสารล่าสุดเกี่ยวกับข้อตกลงได้ที่เครื่องมือค้นหา.
เวบัลตา
แน่นอนว่าเครื่องมือค้นหาที่เรียกว่านี้คุ้นเคยกับคุณ คุณต้องเลือกมันเหมือนติ๊กจากเบราว์เซอร์ของคุณหรือไม่?เป็นเวลานานแล้วที่ทุกคนรู้เกี่ยวกับเรื่องมืดของเครื่องมือค้นหานี้ อนิจจาไม่มีใครสนใจ PS นี้ ผู้ใช้กำลังมองหาบทความเกี่ยวกับวิธีลบอึนี้ออกจากคอมพิวเตอร์เท่านั้น
นิกมา
เครื่องมือค้นหานี้แตกต่างอย่างมากจากที่อื่น และหากฐานดัชนีของเครื่องมือค้นหาอื่นไม่ทำให้ใครแปลกใจความสามารถในการแก้ปัญหาในวิชาเคมีและคณิตศาสตร์ก็ทำให้ Nigma แตกต่างจากเครื่องมือค้นหาอื่น ๆ Nigma ยังเสนอการค้นหาเพลง หนังสือ เกม และทอร์เรนต์อีกด้วย
เครื่องมือค้นหาที่สร้างขึ้นตามคำสั่งของรัฐบาลรัสเซียถือเป็นเครื่องมือค้นหาของรัฐแห่งแรกของโลก เสนอการค้นหาทางการแพทย์แยกต่างหาก (ค้นหาร้านขายยา ยา และบทความเกี่ยวกับโรค) ธีมที่สะดวกสบายมากกับ "ประเทศที่สะดวกสบาย" ซึ่งรวบรวมคำแนะนำทั้งหมดที่ช่วยเหลือพลเมืองไว้ในที่เดียว ตัวอย่างเช่นนี่คือส่วน "เอกสาร"
PS นี้แตกต่างอย่างมากจาก PS นี้มีเครื่องมือค้นหาประเภทใดบ้างบนอินเทอร์เน็ต?. DuckDuckGo - เครื่องมือค้นหา โอเพ่นซอร์สและนโยบายที่น่าสนใจในการไม่ใช้ "ฟองสบู่ตัวกรอง" สำหรับผู้ที่ไม่ทราบ: "กรอบตัวกรอง" คือการที่เครื่องมือค้นหาแสดงในผลการค้นหาเฉพาะผลการค้นหาที่ (PS นี้) พิจารณาว่าจำเป็นสำหรับผู้ใช้บางรายเท่านั้น ในขณะเดียวกันก็ไม่มีใครสนใจความคิดเห็นของผู้ใช้เอง DuckDuckGo รับรองว่าการใช้เครื่องมือค้นหาทำให้มั่นใจได้ว่าคุณจะได้รับข้อมูลทั้งหมดที่เครื่องมือค้นหามี
“DuckDuckGo” กำลังได้รับแรงผลักดัน เมื่อถึงฤดูร้อนนี้ (2558) ผู้สร้าง PS ได้รายงานคำขอสามพันล้านคำขอเป็นรายปี
ขณะที่เขียนบทความนี้ ฉันมีคำถามหลายข้อ ในกรณีเช่นนี้ ฉันไม่พึ่งพาการส่งผู้ร้ายข้ามแดน ใช่ แล้วทำไม ถ้ามีคนนั่งข้างๆ ฉันที่รู้ทุกอย่างเกี่ยวกับอินเทอร์เน็ต? บทสัมภาษณ์สั้น ๆ กับ Igor Ivanov
อิกอร์ อิวานอฟ
หัวหน้าสตูดิโอ SEMANTICA
หากเว็บไซต์ของฉันอยู่ใน Google และ Yandex ไซต์ของฉันจะอยู่ด้านบนสุดของผลลัพธ์ในเครื่องมือค้นหาอื่นๆ ที่มีขนาดเล็กกว่าหรือไม่
มีความเป็นไปได้สูงมากที่สิ่งนี้จะเกิดขึ้น Yandex และ Google กำลังพัฒนาอัลกอริทึมในทิศทางที่ถูกต้อง และเครื่องมือค้นหาอื่นๆ กำลังติดตามตัวอย่างของพวกเขา มีกรณีที่ผู้เชี่ยวชาญของ Google สังเกตเห็นว่าเครื่องมือค้นหาของ Bing ไม่เพียงแต่คัดลอกอัลกอริธึมเท่านั้น แต่ยังรวมถึงผลการค้นหาด้วย
เหตุใดจึงมีความน่าจะเป็นและไม่ใช่ความแน่นอนสัมบูรณ์? เพราะเสิร์ชเอ็นจิ้นอื่นๆ จะไม่มีเวลาปรับอัลกอริธึมการจัดอันดับให้เป็นมาตรฐานที่กำหนดโดยคู่แข่งที่ประสบความสำเร็จมากกว่า
มันคุ้มค่าที่จะโปรโมตใน Sputnik, Mail และเครื่องมือค้นหา "ของเรา" อื่น ๆ หรือไม่? เครื่องมือค้นหาไหนดีกว่ากัน?
ไม่ต้องสงสัยเลยว่าคุ้มค่าใน Mail.ru มีการจราจรบ้างหรือค่อนข้างน้อย แต่ก็มีอยู่ และคนเหล่านี้คือลูกค้า สปุตนิกและเครื่องมือค้นหาอื่น ๆ เป็นเพียงตำนานเช่นโซเชียลเน็ตเวิร์ก "My World" ทุกคนรู้ว่ามีอยู่จริง แต่ไม่มีใครเห็น :)
การสร้างเครื่องมือค้นหาใหม่ถือเป็นแนวคิดที่ไม่ธรรมดา ทำไมคุณถึงคิดว่ามีสิ่งใหม่ๆ ปรากฏขึ้นเป็นระยะๆ?
ใครก็ตามที่เป็นเจ้าของข้อมูลจะเป็นเจ้าของโลก ดูสิว่ามีกี่บริษัทที่ต้องพึ่งพาเครื่องมือค้นหา และมีกี่คนที่ไม่รู้จักทางเลือกอื่น? ใครจะปฏิเสธเรื่องนี้? การลงทุนใดๆ ก็ตามจะสมเหตุสมผลหากคุณบรรลุผลสำเร็จ
และผลที่ตามมาของสิ่งนี้ - ปล้น, ปล้นสะดม, เงินไม่มีที่สิ้นสุดออกมาจากอากาศ, ไม่มีอะไรเลย... คุณไม่จำเป็นต้องมีทรัพยากรหรือผู้คน (ฉันหมายความว่าคุณไม่จำเป็นต้องมีชาวอินเดียนับล้านล้านคนที่ค้นหา ผ่านสารานุกรมสำหรับทุกคำขอของผู้ใช้)
ปัจจุบันคุณภาพการค้นหาไม่ส่งผลต่อจำนวนผู้ใช้ ตัวอย่างเช่น Google: ในรัสเซียมีผู้ชมประมาณ 30-35% แต่สร้างเบราว์เซอร์ Chrome ที่ปฏิวัติวงการและด้วยช่วยเพิ่มจำนวนผู้ชมได้อย่างมาก
ฉันแน่ใจว่าเสิร์ชเอ็นจิ้นแม้จะมีเทคโนโลยีที่เรียบง่าย แต่ด้วยแนวทางการตลาดที่ปฏิวัติวงการสามารถดึงดูดผู้ชมและบีบส่วนหนึ่งของตลาดออกไปได้
ทั้งหมด
การแนะนำ
ปัจจุบันมีเพียงไม่กี่คนที่จินตนาการถึงอินเทอร์เน็ตที่ไม่มีการค้นหา ผลการค้นหา และระบบค้นหาข้อมูล (IRS) ที่จัดระเบียบทุกอย่าง แต่จนกระทั่งเมื่อไม่นานมานี้ ข้อมูลทางอินเทอร์เน็ตทั้งหมดรวมอยู่ในไดเร็กทอรีหลายแห่ง ซึ่งชื่อดังกล่าวยังคงเป็นที่รู้จักกันดี (DMOZ, Yahoo)
ปัจจุบัน ปริมาณข้อมูลบนอินเทอร์เน็ตมีมากจนไม่สามารถบรรจุลงในแค็ตตาล็อกใดๆ ได้ ในการประมวลผล จัดเก็บข้อมูล และจัดระเบียบการค้นหา ผลิตภัณฑ์ซอฟต์แวร์ที่มีประสิทธิภาพได้ถูกสร้างขึ้นและยังคงสร้างต่อไป ซึ่งเราเรียกว่าเครื่องมือค้นหา (SE) เครื่องมือค้นหาแต่ละอัน (เครื่องมือค้นหา) มีฐานข้อมูลของตัวเอง อัลกอริธึมของตัวเองสำหรับการประมวลผล การค้นหา การจัดอันดับ และการแสดงข้อมูล
เครื่องมือค้นหาทางอินเทอร์เน็ตมี
สามารถให้คำจำกัดความทางวิชาการของเครื่องมือค้นหาต่อไปนี้ได้ ระบบค้นหาคือชุดของโปรแกรมและวิธีการทางเทคนิคสำหรับจัดระเบียบการค้นหาของผู้ใช้บนอินเทอร์เน็ต ซึ่งเมื่อตอบกลับข้อความค้นหา ผู้ใช้จะได้รับรายการผลลัพธ์ที่เกี่ยวข้อง (สอดคล้องกับคำขอ)
การออกจะทำในรูปแบบของรายการลิงก์ไปยังแหล่งข้อมูลพร้อมคำอธิบายสั้น ๆ (ตัวอย่าง) บางครั้งก็มีรูปถ่าย
สำหรับตัวอย่างแรก จำผู้นำการค้นหาระดับโลก "Google" และผู้นำของเครื่องมือค้นหา Runet "Yandex" นอกจากเครื่องมือค้นหาเหล่านี้แล้ว คุณยังสามารถตั้งชื่อเครื่องมือค้นหาที่มีอยู่ได้อีกนับสิบรายการ ซึ่งเราจะพูดถึงด้านล่าง
ความคิดเห็น: เครื่องมือค้นหา Google, Yandex และอื่น ๆ ไม่ใช่ผู้สร้าง (ผู้ผลิต) เนื้อหา แต่เป็นผู้รวบรวม (ผู้สะสม) เนื้อหาและโดยส่วนใหญ่แล้วคือเนื้อหาของผู้อื่น เป็นเรื่องที่ควรค่าแก่การจำไว้ว่าการใช้เนื้อหาของผู้อื่นเพื่อสร้างการเข้าชมของคุณเองและสร้างรายได้จากเนื้อหานั้นสามารถจัดได้ว่าเป็น "การละเมิดลิขสิทธิ์" ซึ่งแน่นอนว่าไม่ได้เกิดขึ้นในความเป็นจริง
เรตติ้ง
- และ Google แบ่งผู้นำสองอันดับแรก: ประมาณ 49% และ 45%
- อันดับที่สาม: ค้นหา Mail.ru ประมาณ 3%;
- เครื่องมือค้นหาอื่นๆ ลอยต่ำกว่า 1%
ฉันดูสถิติบน Google Analytics:
- ยานเดกซ์/อินทรีย์ 40.26%
- กูเกิล/ออร์แกนิก 38.93%
- mail.ru/ออร์แกนิก 0.60%
- คนเดินเตร่/ออร์แกนิก 0.52%
- บิง/ออร์แกนิค 0.12%
สถิติไม่มีวันสิ้นสุด: การค้นหา Yandex ถูกใช้เป็นส่วนใหญ่และหากคุณพิจารณาว่า 3% เป็นผลลัพธ์ที่ดีเมื่อเทียบกับ 45% การค้นหา Mail.ru ก็สามารถเรียกได้ว่าเป็นที่นิยมมากที่สุดเป็นอันดับสาม
ในเรื่องนี้การอภิปรายเกี่ยวกับความนิยมของเครื่องมือค้นหาอื่นที่ไม่ใช่ Yandex และ Google สามารถนำมาประกอบกับความเชื่อโชคลางและการโปรโมตไซต์พิเศษในเครื่องมือค้นหาอื่น ๆ (ไม่ใช่ Yandex และ Google) ไม่สมควรได้รับความสนใจ
เครื่องมือค้นหาทำงานอย่างไร
คำถามเกี่ยวกับการทำงานของเครื่องมือค้นหาก็เหมือนกับคำถามที่ว่า "ท้องฟ้ามีสีอะไร" หากท้องฟ้าเป็นสีฟ้า เสิร์ชเอ็นจิ้นจะรวบรวมข้อมูลบนอินเทอร์เน็ต ประมวลผล จัดอันดับ และส่งให้กับผู้ใช้ตามคำค้นหา
ทฤษฎีการค้นหาทางอินเทอร์เน็ตนั้นกว้างขวางกว่ามากและไม่สามารถนำเสนอในบทความได้ อย่างไรก็ตาม ประเด็นหลักจะเป็นประโยชน์สำหรับเรา:
เครื่องมือค้นหาทางอินเทอร์เน็ตไม่จัดเก็บเอกสารนั่นคือไม่ดาวน์โหลดและอัปโหลดเอกสารทั้งหมดไปยังที่เก็บของตน
กรมสรรพากรใช้อินเทอร์เน็ตเป็นที่จัดเก็บเอกสารแบบกระจายอำนาจ เสิร์ชเอ็นจิ้นจะรวบรวมข้อมูลอินเทอร์เน็ตเป็นระยะ เลือกข้อมูลที่ต้องการตามอัลกอริธึม และวางบางส่วน (ข้อมูล) ลงในฐานข้อมูล (ฐานข้อมูล) สิ่งนี้นำไปสู่ปัญหาหลายประการ:
- ระบบเรียกค้นข้อมูลไม่ได้ใช้ข้อมูลทั้งหมดบนอินเทอร์เน็ต แต่ใช้เพียงบางส่วนเท่านั้น
- ข้อมูลอินเทอร์เน็ตมีการเปลี่ยนแปลงบ่อยครั้ง มีการเพิ่มหน้าประมาณ 1,500,000 หน้าต่อวัน ดังนั้นจึงเป็นไปได้ที่ "เอาต์พุตว่างเปล่า"
- มีรายการที่ซ้ำกันจำนวนมาก (เนื้อหาที่ซ้ำกัน) น่าเสียดายที่ฉันไม่มีข้อมูลเทคที่แน่นอน และตัวเลข 25% ที่รายงานของเทคดูสูงเกินไป
- มีโฆษณาจำนวนมากซึ่งเครื่องมือค้นหาก็ข้ามไปเช่นกัน
- “การพเนจร” ของโรบ็อตการค้นหาบนเครือข่ายช่วยเพิ่มภาระให้กับทรัพยากรอย่างมาก (ใช้ไม่ได้กับเครื่องมือค้นหา)
- ไซต์ส่วนใหญ่เป็นไซต์เชิงพาณิชย์ (ประมาณ 83%) และมีคุณค่าทางข้อมูลเพียงเล็กน้อย
ด้วยเหตุผลเหล่านี้และเหตุผลอื่นๆ ระบบการสืบค้นข้อมูลทางอินเทอร์เน็ตส่วนใหญ่จึงใช้รูปแบบการค้นหาคำหลัก (เครื่องมือค้นหา) แทนที่จะเป็นรูปแบบการค้นหาแบบคลาสสิกตามการจำแนกข้อมูล
คุณสมบัติของการค้นหาคำหลัก
แม้จะมีการเปลี่ยนแปลงอัลกอริธึมของเครื่องมือค้นหาซึ่งโฆษณาพยายามโน้มน้าวเราว่าเครื่องจักรมีความชาญฉลาดและเข้าใจมากขึ้น แต่พื้นฐานของการทำงานของเครื่องมือค้นหาก็คือการค้นหาคำหลัก
ฉันชอบรูปแบบการค้นหาคำหลักนี้
อย่างที่คุณเห็นการทำงานของเสิร์ชเอ็นจิ้นทางอินเทอร์เน็ตนั้นขึ้นอยู่กับการค้นหาเอกสารใหม่ (โรบ็อตการค้นหา Spider + Crawler) การจัดทำดัชนีเอกสารที่ตรวจพบ (Indexer) และการดำเนินการค้นหาของผู้ใช้ (Search Engine Results Engine) ชื่อของโรบ็อตการค้นหาที่ใช้เพื่อวัตถุประสงค์เหล่านี้แสดงอยู่ในวงเล็บ
อย่างที่ฉันบอกไป เสิร์ชเอ็นจิ้นส่วนใหญ่ไม่คัดลอกข้อความทั้งหมดของเอกสารลงในฐานข้อมูล สำหรับการค้นหา เมื่อจัดทำดัชนีเอกสาร รูปภาพการค้นหาจะถูกสร้างขึ้น เพื่อจัดระเบียบการค้นหาตาม โรบ็อตสร้างดัชนีจะสร้างภาพของเอกสารโดยใช้สิ่งที่เรียกว่าวิธีการรับ นั่นคือรูปภาพเอกสารประกอบด้วยชื่อเรื่องและชุดคำสำคัญ
อย่างไรก็ตาม สามารถระบุได้ค่อนข้างแม่นยำว่า IPS ทั้งหมดให้ความสนใจกับสิ่งต่อไปนี้:
- การแสดงตนของคำหลักใน
เอกสาร; - การมีอยู่ของคีย์ใน URL หรือโดเมน
- การมีอยู่ของคีย์ในคำบรรยาย
- จำนวนคีย์ทั้งหมดบนเพจ (ความหนาแน่น%);
- การปรากฏตัวของคีย์ในคำอธิบาย
- เว็บลิงก์ใดที่นำไปสู่หน้านี้
- มีลิงค์ภายในอะไรบ้างในหน้านี้?
การจัดอันดับหน้า
ในตอนท้ายของทฤษฎีก็คุ้มค่าที่จะกล่าวถึง บ่อยครั้งที่การจัดอันดับหน้าใน SERP ถูกกล่าวถึงในบริบทของความเกี่ยวข้อง นั่นคือเครื่องมือค้นหาจะต้องสร้างผลการค้นหาให้ตรงกับคำค้นหาให้ใกล้เคียงที่สุด ตามที่ยานเดกซ์เขียนไม่ควรสูญเสียสิ่งใด (ความสมบูรณ์ของผลลัพธ์) และไม่ควรพบสิ่งใดที่ไม่จำเป็น (ความแม่นยำของผลลัพธ์) คุณจะเห็นว่าสิ่งนี้ได้ผลอย่างไรในทางปฏิบัติทุกวัน
บทสรุป
- เครื่องมือค้นหาทางอินเทอร์เน็ตเป็นผลิตภัณฑ์ซอฟต์แวร์ที่ซับซ้อนซึ่งงานนี้ได้รับการสนับสนุนจากผู้เชี่ยวชาญหลายพันคนและทรัพยากรวัสดุจำนวนมหาศาล
- อัลกอริธึมของเครื่องมือค้นหาจะถูกเก็บเป็นความลับ แม้ว่าจุดเน้นหลักของการอัปเดตอัลกอริธึมจะเปิดเผยต่อสาธารณะและมีชื่อที่ถูกต้อง
- แม้จะมีแนวทางที่แตกต่างกันในการสร้างผลการค้นหา แต่เครื่องมือค้นหาทั้งหมดก็ยึดตามหลักการทั่วไปของการจัดทำดัชนีหน้าเว็บ ซึ่งจนถึงทุกวันนี้ยังคงเป็นพื้นฐานสำหรับการโปรโมต
เครื่องมือค้นหายานเดกซ์
เครื่องมือค้นหา Runet ยอดนิยมที่มักจะได้รับความนิยมสูงสุด จากสถิติของปี 2009 ยานเดกซ์รวบรวมข้อมูล Runet 15 ล้านหน้าอย่างต่อเนื่อง ประมวลผลข้อมูลข้อความ 140,000 GB รูปภาพที่ไม่ซ้ำ 1.6 พันล้านรูปภาพจากทั้งหมด 2.1 พันล้านรูปภาพ
เครื่องมือค้นหา Yandex ถูกสร้างขึ้นในปี 1993 คำว่ายานเดกซ์ไม่ได้หมายถึงอะไรเลย แม้ว่าจะเป็นที่ยอมรับกันโดยทั่วไปว่าเป็นการเปลี่ยนแปลงของคำว่า "ดัชนี" หรือวลี "ยังมีตัวทำดัชนีอื่น" ปัจจุบัน Yandex.Search ประมวลผลคำขอถึงหนึ่งในสี่ของพันล้านคำขอต่อวัน และถ้ามันรบกวนมาก เครื่องมือค้นหาที่ฉันชื่นชอบก็คงจะเป็น
ค้นหายานเดกซ์
https://yandex.ru/: การค้นหาผู้ใช้ Yandex ได้รับการจัดระเบียบบนอินเทอร์เน็ตโดยคำนึงถึงภูมิภาคของผู้ใช้ ความสามารถในการค้นหาด้วยรูปภาพ วิดีโอ แผนที่ ข่าวสาร บล็อก ผลิตภัณฑ์ และพจนานุกรม
สำหรับการค้นหาแบบละเอียด มีภาษาการค้นหาที่นี่ (https://yandex.ru/support/search/query-language/)
เครื่องมือค้นหาทางอินเทอร์เน็ต Yandex
เครื่องมือค้นหาของ Google
ในเครื่องมือค้นหาของ Google การค้นหาจะถูกจัดระเบียบโดยไม่มีหัวข้อ (การค้นหาหลัก) และการค้นหาตามส่วน: รูปภาพ ข่าว แผนที่ วิดีโอ ช็อปปิ้ง หนังสือ ตั๋วเครื่องบิน การเงิน
มีการตั้งค่า:
ค้นหาอย่างปลอดภัยช่วยให้คุณสามารถบล็อกเนื้อหาที่ไม่เหมาะสมและรูปภาพเกี่ยวกับเรื่องเพศจากผลการค้นหาของ Google คุณสมบัตินี้ไม่รับประกันการป้องกัน 100% แต่จะซ่อนเนื้อหาส่วนใหญ่ไว้
การตั้งค่าจำนวนผลลัพธ์ต่อหน้า (ค่าเริ่มต้น 10)
ผลลัพธ์ส่วนบุคคล. ค้นหาลิงก์ รูปภาพ และวิดีโอบน Google ที่เพื่อนของคุณแชร์กับคุณบนเครือข่ายโซเชียล
การเลือกภูมิภาค. ค่าเริ่มต้นคือภูมิภาคปัจจุบัน
ภาษา.คุณสามารถระบุภาษาการค้นหาได้
การค้นหาขั้นสูงช่วยให้คุณค้นหาโดยใช้พารามิเตอร์ขั้นสูง
เครื่องมือ.ที่นี่คุณสามารถเลือกภาษาในการค้นหา ระบุเวลาที่ข้อมูลปรากฏ และเลือกการจับคู่แบบตรงทั้งหมดหรือผลการค้นหาทั้งหมด
เครื่องมือค้นหาทางอินเทอร์เน็ต Google
เครื่องมือค้นหาเมล
https://go.mail.ru/ ที่นี่การค้นหาจะถูกจัดระเบียบบนอินเทอร์เน็ต (การค้นหาทั่วไป) ตามวิดีโอและรูปภาพ มีการค้นหาแอปพลิเคชันสำหรับอุปกรณ์มือถือแยกต่างหาก
(https://www.bing.com/?scope=web&FORM=Z9LH). ค้นหาทั่วไป ค้นหาด้วยรูปภาพ วีดีโอ ข่าว แผนที่
ค้นหา Yahoo ในภาษารัสเซีย. https://ru.search.yahoo.com/ การค้นหาที่แท้จริงโดยไม่ต้องโฆษณา ค้นหาทางอินเทอร์เน็ตโดยใช้รูปภาพและข่าวสาร เลือกเวลาที่จะเพิ่มข้อมูล
เครื่องมือค้นหาอื่น ๆ
- DuckDuckGo (https://duckduckgo.com/) การค้นหาอัจฉริยะ
- Pipl (https://pipl.com/) ค้นหาผู้คนในสหรัฐอเมริกา
- ค้นหาเสียง (http://www.findsounds.com/
นี่คืออะไร
DuckDuckGo เป็นเสิร์ชเอ็นจิ้นโอเพ่นซอร์สที่ค่อนข้างเป็นที่รู้จัก เซิร์ฟเวอร์ตั้งอยู่ในสหรัฐอเมริกา นอกเหนือจากโรบ็อตของมันเองแล้ว เสิร์ชเอ็นจิ้นยังใช้ผลลัพธ์จากแหล่งอื่น: Yahoo, Bing, Wikipedia
ยิ่งดี.
DuckDuckGo วางตำแหน่งตัวเองเป็นเครื่องมือค้นหาที่ให้ความเป็นส่วนตัวและการรักษาความลับสูงสุด ระบบจะไม่รวบรวมข้อมูลใด ๆ เกี่ยวกับผู้ใช้ ไม่จัดเก็บบันทึก (ไม่มีประวัติการค้นหา) และการใช้คุกกี้จะถูกจำกัดเท่าที่เป็นไปได้
DuckDuckGo จะไม่รวบรวมหรือแบ่งปันข้อมูลส่วนบุคคลจากผู้ใช้ นี่คือนโยบายความเป็นส่วนตัวของเรา
กาเบรียล ไวน์เบิร์ก ผู้ก่อตั้ง DuckDuckGo
ทำไมคุณถึงต้องการสิ่งนี้
เสิร์ชเอ็นจิ้นหลักทั้งหมดพยายามปรับแต่งผลการค้นหาตามข้อมูลเกี่ยวกับบุคคลที่อยู่หน้าจอมอนิเตอร์ ปรากฏการณ์นี้เรียกว่า "ฟองอากาศตัวกรอง": ผู้ใช้จะเห็นเฉพาะผลลัพธ์ที่สอดคล้องกับการตั้งค่าของเขาหรือที่ระบบเห็นว่าเป็นเช่นนั้น
สร้างภาพวัตถุประสงค์ที่ไม่ขึ้นอยู่กับพฤติกรรมที่ผ่านมาของคุณบนอินเทอร์เน็ต และกำจัดการโฆษณาตามธีมของ Google และ Yandex ตามคำถามของคุณ ด้วย DuckDuckGo ทำให้ง่ายต่อการค้นหาข้อมูลในภาษาต่างประเทศ ในขณะที่ Google และ Yandex โดยค่าเริ่มต้นจะให้ความสำคัญกับไซต์ภาษารัสเซีย แม้ว่าจะป้อนข้อความค้นหาในภาษาอื่นก็ตาม
นี่คืออะไร
not Evil เป็นระบบที่ค้นหาเครือข่าย Tor ที่ไม่ระบุชื่อ หากต้องการใช้งาน คุณต้องไปที่เครือข่ายนี้ เช่น โดยการเปิดตัวไฟล์ .
not Evil ไม่ใช่เครื่องมือค้นหาเดียวในประเภทนี้ มี LOOK (การค้นหาเริ่มต้นในเบราว์เซอร์ของ Tor ซึ่งสามารถเข้าถึงได้จากอินเทอร์เน็ตปกติ) หรือ TORCH (หนึ่งในเครื่องมือค้นหาที่เก่าแก่ที่สุดในเครือข่าย Tor) และอื่นๆ เราตัดสินว่าไม่ใช่ Evil เนื่องจากคำใบ้ที่ชัดเจนจาก Google (เพียงดูที่หน้าเริ่มต้น)
ยิ่งดี.
ค้นหาตำแหน่งที่ Google, Yandex และเครื่องมือค้นหาอื่นๆ ปิดโดยทั่วไป
ทำไมคุณถึงต้องการสิ่งนี้
เครือข่าย Tor มีทรัพยากรมากมายที่ไม่สามารถพบได้บนอินเทอร์เน็ตที่ปฏิบัติตามกฎหมาย และจำนวนของพวกเขาจะเพิ่มขึ้นเมื่อรัฐบาลควบคุมเนื้อหาอินเทอร์เน็ตที่เข้มงวดมากขึ้น Tor เป็นเครือข่ายประเภทหนึ่งภายในอินเทอร์เน็ตที่มีโซเชียลเน็ตเวิร์ก ตัวติดตามทอร์เรนต์ สื่อ แพลตฟอร์มการซื้อขาย บล็อก ห้องสมุด และอื่นๆ ของตัวเอง
3. ยาซี
นี่คืออะไร
YaCy เป็นเครื่องมือค้นหาแบบกระจายอำนาจที่ทำงานบนหลักการของเครือข่าย P2P คอมพิวเตอร์แต่ละเครื่องที่ติดตั้งโมดูลซอฟต์แวร์หลักจะสแกนอินเทอร์เน็ตอย่างอิสระ กล่าวคือ มันคล้ายคลึงกับโรบ็อตการค้นหา ผลลัพธ์ที่ได้รับจะถูกรวบรวมไว้ในฐานข้อมูลทั่วไปที่ผู้เข้าร่วม YaCy ทุกคนใช้
ยิ่งดี.
เป็นการยากที่จะบอกว่าสิ่งนี้ดีขึ้นหรือแย่ลง เนื่องจาก YaCy เป็นแนวทางที่แตกต่างอย่างสิ้นเชิงในการจัดการการค้นหา การไม่มีเซิร์ฟเวอร์เครื่องเดียวและบริษัทที่เป็นเจ้าของทำให้ผลลัพธ์ไม่ขึ้นอยู่กับความต้องการของใครก็ตาม ความเป็นอิสระของแต่ละโหนดช่วยลดการเซ็นเซอร์ YaCy สามารถค้นหาเว็บระดับลึกและเครือข่ายสาธารณะที่ไม่ได้จัดทำดัชนีได้
ทำไมคุณถึงต้องการสิ่งนี้
หากคุณเป็นผู้สนับสนุนซอฟต์แวร์โอเพ่นซอร์สและอินเทอร์เน็ตฟรี ที่ไม่อยู่ภายใต้อิทธิพลของหน่วยงานภาครัฐและองค์กรขนาดใหญ่ YaCy คือทางเลือกของคุณ นอกจากนี้ยังสามารถใช้เพื่อจัดระเบียบการค้นหาภายในองค์กรหรือเครือข่ายอัตโนมัติอื่นๆ และถึงแม้ว่า YaCy จะไม่มีประโยชน์ในชีวิตประจำวันมากนัก แต่ก็เป็นทางเลือกที่คุ้มค่าสำหรับ Google ในแง่ของกระบวนการค้นหา
4. พิพล
นี่คืออะไร
Pipl คือระบบที่ออกแบบมาเพื่อค้นหาข้อมูลเกี่ยวกับบุคคลใดบุคคลหนึ่งโดยเฉพาะ
ยิ่งดี.
ผู้เขียน Pipl อ้างว่าอัลกอริธึมพิเศษของพวกเขาค้นหาได้อย่างมีประสิทธิภาพมากกว่าเครื่องมือค้นหา "ปกติ" โดยเฉพาะอย่างยิ่ง ให้ความสำคัญกับโปรไฟล์โซเชียลเน็ตเวิร์ก ความคิดเห็น รายชื่อสมาชิก และฐานข้อมูลต่างๆ ที่เผยแพร่ข้อมูลเกี่ยวกับบุคคล เช่น ฐานข้อมูลคำตัดสินของศาล ความเป็นผู้นำของ Pipl ในด้านนี้ได้รับการยืนยันจากการประเมินจาก Lifehacker.com, TechCrunch และสิ่งพิมพ์อื่น ๆ
ทำไมคุณถึงต้องการสิ่งนี้
หากคุณต้องการค้นหาข้อมูลเกี่ยวกับบุคคลที่อาศัยอยู่ในสหรัฐอเมริกา Pipl จะมีประสิทธิภาพมากกว่า Google มาก เห็นได้ชัดว่าฐานข้อมูลของศาลรัสเซียไม่สามารถเข้าถึงเครื่องมือค้นหาได้ ดังนั้นเขาจึงไม่สามารถรับมือกับพลเมืองรัสเซียได้ดีนัก
นี่คืออะไร
FindSounds เป็นอีกหนึ่งเครื่องมือค้นหาเฉพาะทาง ค้นหาเสียงต่างๆ ในโอเพ่นซอร์ส เช่น บ้าน ธรรมชาติ รถยนต์ ผู้คน และอื่นๆ บริการนี้ไม่รองรับข้อความค้นหาในภาษารัสเซีย แต่มีรายการแท็กภาษารัสเซียที่น่าประทับใจซึ่งคุณสามารถใช้ค้นหาได้
ยิ่งดี.
เอาต์พุตมีเพียงเสียงและไม่มีอะไรพิเศษ ในการตั้งค่าคุณสามารถกำหนดรูปแบบและคุณภาพเสียงที่ต้องการได้ เสียงทั้งหมดที่พบพร้อมให้ดาวน์โหลด มีการค้นหาตามรูปแบบ
ทำไมคุณถึงต้องการสิ่งนี้
หากคุณต้องการค้นหาเสียงปืนคาบศิลา เสียงนกหัวขวานดูดนม และเสียงร้องของ Homer Simpson อย่างรวดเร็ว บริการนี้เหมาะสำหรับคุณ และเราเลือกสิ่งนี้จากข้อความค้นหาภาษารัสเซียที่มีอยู่เท่านั้น ในภาษาอังกฤษ สเปกตรัมจะกว้างยิ่งขึ้น
จริงๆ แล้ว บริการพิเศษจำเป็นต้องมีผู้ชมที่เชี่ยวชาญเป็นพิเศษ แต่จะเกิดอะไรขึ้นถ้ามันมีประโยชน์สำหรับคุณเช่นกัน?
นี่คืออะไร
Wolfram|Alpha เป็นเครื่องมือค้นหาทางคอมพิวเตอร์ แทนที่จะลิงก์ไปยังบทความที่มีคำหลัก จะให้คำตอบสำเร็จรูปสำหรับคำขอของผู้ใช้ ตัวอย่างเช่น หากคุณป้อน "เปรียบเทียบประชากรของนิวยอร์กและซานฟรานซิสโก" ลงในแบบฟอร์มการค้นหาเป็นภาษาอังกฤษ Wolfram|Alpha จะแสดงตารางและกราฟพร้อมการเปรียบเทียบทันที
ยิ่งดี.
บริการนี้ดีกว่าบริการอื่นในการค้นหาข้อเท็จจริงและคำนวณข้อมูล Wolfram|Alpha รวบรวมและจัดระเบียบความรู้ที่มีอยู่บนเว็บจากหลากหลายสาขา รวมถึงวิทยาศาสตร์ วัฒนธรรม และความบันเทิง หากฐานข้อมูลนี้มีคำตอบสำเร็จรูปสำหรับคำค้นหา ระบบจะแสดง หากไม่มี ระบบจะคำนวณและแสดงผลลัพธ์ ในกรณีนี้ ผู้ใช้จะไม่เห็นสิ่งใดที่ไม่จำเป็น
ทำไมคุณถึงต้องการสิ่งนี้
ตัวอย่างเช่น หากคุณเป็นนักศึกษา นักวิเคราะห์ นักข่าว หรือนักวิจัย คุณสามารถใช้ Wolfram|Alpha เพื่อค้นหาและคำนวณข้อมูลที่เกี่ยวข้องกับงานของคุณได้ บริการนี้ไม่เข้าใจคำขอทั้งหมด แต่มีการพัฒนาและฉลาดขึ้นอย่างต่อเนื่อง
นี่คืออะไร
เอ็นจิ้น metasearch ของ Dogpile แสดงรายการผลลัพธ์รวมจากผลการค้นหาจาก Google, Yahoo และระบบยอดนิยมอื่น ๆ
ยิ่งดี.
ประการแรก Dogpile แสดงโฆษณาน้อยลง ประการที่สอง บริการใช้อัลกอริธึมพิเศษเพื่อค้นหาและแสดงผลลัพธ์ที่ดีที่สุดจากเครื่องมือค้นหาต่างๆ จากข้อมูลของนักพัฒนา Dogpile ระบบของพวกเขาสร้างผลการค้นหาที่สมบูรณ์ที่สุดบนอินเทอร์เน็ตทั้งหมด
ทำไมคุณถึงต้องการสิ่งนี้
หากคุณไม่พบข้อมูลบน Google หรือเครื่องมือค้นหามาตรฐานอื่นๆ ให้ค้นหาในเครื่องมือค้นหาหลายรายการพร้อมกันโดยใช้ Dogpile
นี่คืออะไร
BoardReader คือระบบสำหรับค้นหาข้อความในฟอรั่ม บริการคำถามและคำตอบ และชุมชนอื่นๆ
ยิ่งดี.
บริการนี้ช่วยให้คุณสามารถจำกัดช่องค้นหาของคุณให้แคบลงไปยังแพลตฟอร์มโซเชียลได้ ด้วยตัวกรองพิเศษ คุณสามารถค้นหาโพสต์และความคิดเห็นที่ตรงกับเกณฑ์ของคุณได้อย่างรวดเร็ว: ภาษา วันที่ตีพิมพ์ และชื่อเว็บไซต์
ทำไมคุณถึงต้องการสิ่งนี้
BoardReader มีประโยชน์สำหรับผู้เชี่ยวชาญด้านประชาสัมพันธ์และผู้เชี่ยวชาญด้านสื่ออื่นๆ ที่สนใจความคิดเห็นของมวลชนในบางประเด็น
ในที่สุด
ชีวิตของเครื่องมือค้นหาทางเลือกมักจะเกิดขึ้นเพียงชั่วครู่ Lifehacker ถามอดีตผู้อำนวยการทั่วไปของ Yandex สาขายูเครน Sergei Petrenko เกี่ยวกับโอกาสระยะยาวของโครงการดังกล่าว
เซอร์เกย์ เพเตรนโก
อดีตผู้อำนวยการทั่วไปของ Yandex.Ukraine
สำหรับชะตากรรมของเครื่องมือค้นหาทางเลือกนั้นเป็นเรื่องง่าย: การเป็นโครงการเฉพาะกลุ่มที่มีผู้ชมจำนวนน้อยดังนั้นจึงไม่มีโอกาสทางการค้าที่ชัดเจนหรือในทางกลับกันมีความชัดเจนอย่างสมบูรณ์ถึงการขาดหายไป
หากคุณดูตัวอย่างในบทความคุณจะเห็นได้ว่าเครื่องมือค้นหาดังกล่าวมีความเชี่ยวชาญในช่องที่แคบ แต่ได้รับความนิยมซึ่งอาจยังไม่เติบโตพอที่จะสังเกตเห็นได้ในเรดาร์ของ Google หรือ Yandex หรือกำลังทดสอบ สมมติฐานดั้งเดิมในการจัดอันดับ ซึ่งยังไม่สามารถนำมาใช้กับการค้นหาทั่วไปได้
ตัวอย่างเช่นหากจู่ๆ การค้นหาบน Tor กลายเป็นที่ต้องการนั่นคือผลลัพธ์จากที่นั่นมีความต้องการโดยผู้ชมของ Google อย่างน้อยเปอร์เซ็นต์แน่นอนว่าเครื่องมือค้นหาทั่วไปจะเริ่มแก้ปัญหาวิธีการ ค้นหาและแสดงให้ผู้ใช้เห็น หากพฤติกรรมของผู้ชมแสดงให้เห็นว่าสำหรับผู้ใช้ในสัดส่วนที่มีนัยสำคัญในข้อความค้นหาจำนวนมาก ผลลัพธ์ที่ให้โดยไม่คำนึงถึงปัจจัยที่ขึ้นอยู่กับผู้ใช้นั้นดูมีความเกี่ยวข้องมากกว่า Yandex หรือ Google จะเริ่มสร้างผลลัพธ์ดังกล่าว
“ดีขึ้น” ในบริบทของบทความนี้ไม่ได้หมายความว่า “ดีขึ้นในทุกสิ่ง” ใช่ ในหลาย ๆ ด้านฮีโร่ของเราอยู่ห่างไกลจากยานเดกซ์ (แม้จะอยู่ห่างไกลจาก Bing ด้วยซ้ำ) แต่บริการแต่ละอย่างเหล่านี้มอบบางสิ่งให้กับผู้ใช้ซึ่งยักษ์ใหญ่ในอุตสาหกรรมการค้นหาไม่สามารถให้ได้ แน่นอนว่าคุณคงรู้จักโครงการที่คล้ายกันเช่นกัน แบ่งปันกับเรา - มาพูดคุยกัน
พวกเขากลายเป็นส่วนสำคัญของอินเทอร์เน็ตรัสเซียมายาวนาน ขณะนี้เครื่องมือค้นหาเป็นกลไกขนาดใหญ่และซับซ้อนซึ่งไม่เพียงแต่เป็นตัวแทนของเครื่องมือค้นหาข้อมูลเท่านั้น แต่ยังเป็นพื้นที่ที่ดึงดูดใจสำหรับธุรกิจอีกด้วย
ผู้ใช้เครื่องมือค้นหาส่วนใหญ่ไม่เคยคิด (หรือคิดเกี่ยวกับมัน แต่ไม่พบคำตอบ) เกี่ยวกับหลักการทำงานของเครื่องมือค้นหาเกี่ยวกับรูปแบบการประมวลผลคำขอของผู้ใช้เกี่ยวกับสิ่งที่ระบบเหล่านี้ประกอบด้วยและวิธีการทำงานของมัน...
คลาสมาสเตอร์นี้ออกแบบมาเพื่อตอบคำถามว่าเครื่องมือค้นหาทำงานอย่างไร อย่างไรก็ตาม คุณจะไม่พบปัจจัยที่มีอิทธิพลต่อการจัดอันดับเอกสารที่นี่ ยิ่งกว่านั้นคุณไม่ควรนับคำอธิบายโดยละเอียดของอัลกอริทึม Yandex ตามคำบอกเล่าของ Ilya Segalovich ผู้อำนวยการฝ่ายเทคโนโลยีและการพัฒนาเครื่องมือค้นหา Yandex นั้นมีเพียง Ilya Segalovich เท่านั้นที่จำได้ว่า "ถูกทรมาน"...
2. แนวคิดและหน้าที่ของเครื่องมือค้นหา
ระบบค้นหาคือซอฟต์แวร์และฮาร์ดแวร์ที่ซับซ้อนที่ออกแบบมาเพื่อค้นหาอินเทอร์เน็ตและตอบสนองต่อคำขอของผู้ใช้ที่ระบุในรูปแบบของวลีข้อความ (คำค้นหา) โดยสร้างรายการลิงก์ไปยังแหล่งข้อมูลตามลำดับความเกี่ยวข้อง ( ตามคำขอ) เครื่องมือค้นหาระดับนานาชาติที่ใหญ่ที่สุด: "Google", ยาฮู , เอ็มเอสเอ็น . บนอินเทอร์เน็ตของรัสเซีย ได้แก่ Yandex, Rambler, Aport
มาดูแนวคิดของคำค้นหาโดยใช้เครื่องมือค้นหา Yandex เป็นตัวอย่างกันดีกว่า ผู้ใช้ควรกำหนดคำค้นหาให้สอดคล้องกับสิ่งที่เขาต้องการค้นหาโดยกระชับและเรียบง่ายที่สุด สมมติว่าเราต้องการค้นหาข้อมูลใน Yandex เกี่ยวกับวิธีการเลือกรถยนต์ ในการดำเนินการนี้ ให้เปิดหน้าหลักของยานเดกซ์แล้วป้อนข้อความค้นหา "วิธีเลือกรถยนต์" ต่อไป งานของเราคือการเปิดลิงก์ที่ให้ไว้ตามคำขอของเราไปยังแหล่งข้อมูลบนอินเทอร์เน็ต อย่างไรก็ตาม มีความเป็นไปได้ค่อนข้างมากที่เราจะไม่พบข้อมูลที่เราต้องการ หากสิ่งนี้เกิดขึ้น คุณจะต้องเรียบเรียงคำขอของคุณใหม่ หรือฐานข้อมูลเครื่องมือค้นหาไม่มีข้อมูลที่เกี่ยวข้องกับคำขอของเราจริงๆ (ซึ่งอาจเกิดขึ้นได้เมื่อถามคำถามที่ "แคบ" มาก เช่น "วิธีเลือก" รถยนต์ใน Arkhangelsk”)
เป้าหมายหลักของเครื่องมือค้นหาคือการนำเสนอข้อมูลที่ต้องการแก่ผู้คน และสอนผู้ใช้ให้ทำการร้องขอที่ “ถูกต้อง” ไปยังระบบ เช่น ข้อความค้นหาที่สอดคล้องกับหลักการทำงานของเครื่องมือค้นหานั้นเป็นไปไม่ได้ ดังนั้นนักพัฒนาจึงสร้างอัลกอริธึมและหลักการทำงานของเครื่องมือค้นหาที่จะช่วยให้ผู้ใช้ค้นหาข้อมูลที่ต้องการได้
ซึ่งหมายความว่าเครื่องมือค้นหาจะต้อง “คิด” แบบเดียวกับที่ผู้ใช้คิดเมื่อค้นหาข้อมูล เมื่อผู้ใช้ส่งคำขอไปยังเครื่องมือค้นหา เขาต้องการค้นหาสิ่งที่ต้องการอย่างรวดเร็วและง่ายดายที่สุด เมื่อได้รับผลลัพธ์ เขาประเมินประสิทธิภาพของระบบตามคำแนะนำของพารามิเตอร์พื้นฐานหลายประการ เขาพบสิ่งที่เขากำลังมองหาหรือไม่? หากเขาไม่พบ จะต้องเรียบเรียงคำถามใหม่กี่ครั้งเพื่อค้นหาสิ่งที่เขากำลังมองหา เขาสามารถหาข้อมูลที่เกี่ยวข้องได้มากเพียงใด เครื่องมือค้นหาประมวลผลคำค้นหาได้เร็วแค่ไหน? ผลการค้นหานำเสนอสะดวกเพียงใด ผลลัพธ์ที่คุณกำลังมองหาเป็นอันดับแรกหรือที่ร้อยหรือไม่? พบขยะที่ไม่จำเป็นพร้อมข้อมูลที่เป็นประโยชน์มากน้อยเพียงใด จะพบข้อมูลที่จำเป็นเมื่อเข้าถึงเครื่องมือค้นหา เช่น หนึ่งสัปดาห์หรือหนึ่งเดือน?
เพื่อตอบคำถามเหล่านี้ด้วยคำตอบ นักพัฒนาเครื่องมือค้นหาจึงปรับปรุงอัลกอริธึมและหลักการในการค้นหาอย่างต่อเนื่อง เพิ่มฟังก์ชันและความสามารถใหม่ ๆ และพยายามทุกวิถีทางเพื่อเร่งการทำงานของระบบ
3. ลักษณะสำคัญของเครื่องมือค้นหา
ให้เราอธิบายลักษณะสำคัญของเครื่องมือค้นหา:
- ความสมบูรณ์
ความสมบูรณ์เป็นหนึ่งในคุณสมบัติหลักของระบบการค้นหา ซึ่งเป็นอัตราส่วนของจำนวนเอกสารที่พบโดยการร้องขอต่อจำนวนเอกสารทั้งหมดบนอินเทอร์เน็ตที่ตอบสนองคำขอที่กำหนด ตัวอย่างเช่น หากมี 100 หน้าบนอินเทอร์เน็ตที่มีวลี "วิธีเลือกรถยนต์" และพบเพียง 60 หน้าสำหรับข้อความค้นหาที่เกี่ยวข้อง ความสมบูรณ์ของการค้นหาจะเป็น 0.6 เห็นได้ชัดว่ายิ่งการค้นหาสมบูรณ์มากขึ้นเท่าใด ผู้ใช้ก็จะไม่พบเอกสารที่ต้องการมากขึ้นเท่านั้น โดยมีเงื่อนไขว่าเอกสารนั้นมีอยู่บนอินเทอร์เน็ตเลย
- ความแม่นยำ
ความแม่นยำเป็นคุณสมบัติหลักอีกประการหนึ่งของเครื่องมือค้นหาซึ่งกำหนดโดยระดับที่เอกสารที่พบตรงกับข้อความค้นหาของผู้ใช้ ตัวอย่างเช่น หากข้อความค้นหา "วิธีเลือกรถยนต์" มีเอกสาร 100 ฉบับ โดย 50 รายการในนั้นมีวลี "วิธีเลือกรถยนต์" และส่วนที่เหลือก็มีคำเหล่านี้ (“วิธีเลือกวิทยุที่เหมาะสมและติดตั้งใน รถยนต์") จากนั้นถือว่าความแม่นยำในการค้นหาเท่ากับ 50/100 (=0.5) ยิ่งการค้นหาแม่นยำยิ่งขึ้น ผู้ใช้ก็จะพบเอกสารที่ต้องการได้เร็วยิ่งขึ้นเท่านั้น ก็จะพบ "ขยะ" ประเภทต่าง ๆ น้อยลงในหมู่พวกเขา เอกสารที่พบก็จะไม่สอดคล้องกับคำขอบ่อยขึ้น
- ความเกี่ยวข้อง
ความเกี่ยวข้องเป็นองค์ประกอบที่สำคัญไม่แพ้กันในการค้นหา ซึ่งมีลักษณะเฉพาะคือเวลาที่ผ่านไปจากช่วงเวลาที่เอกสารถูกเผยแพร่บนอินเทอร์เน็ตจนกระทั่งเข้าสู่ฐานข้อมูลดัชนีของเครื่องมือค้นหา ตัวอย่างเช่น หนึ่งวันหลังจากข่าวที่น่าสนใจปรากฏขึ้น ผู้ใช้จำนวนมากหันไปหาเครื่องมือค้นหาที่มีข้อความค้นหาที่เกี่ยวข้อง ผ่านไปไม่ถึงหนึ่งวันนับตั้งแต่มีการเผยแพร่ข้อมูลข่าวในหัวข้อนี้ แต่เอกสารหลักได้รับการจัดทำดัชนีและพร้อมสำหรับการค้นหาแล้วเนื่องจากการมีอยู่ของเครื่องมือค้นหาขนาดใหญ่ที่เรียกว่า "ฐานข้อมูลที่รวดเร็ว" ซึ่ง มีการอัปเดตหลายครั้งต่อวัน
- ความเร็วในการค้นหา
ความเร็วในการค้นหามีความสัมพันธ์อย่างใกล้ชิดกับความต้านทานโหลด ตัวอย่างเช่น ตามข้อมูลของ Rambler Internet Holding LLC วันนี้ในช่วงเวลาทำการ เครื่องมือค้นหาของ Rambler ได้รับคำขอประมาณ 60 รายการต่อวินาที ภาระงานดังกล่าวจำเป็นต้องลดเวลาการประมวลผลคำขอแต่ละรายการ ความสนใจของผู้ใช้และเครื่องมือค้นหาตรงกันที่นี่: ผู้เข้าชมต้องการได้รับผลลัพธ์โดยเร็วที่สุดและเครื่องมือค้นหาจะต้องดำเนินการตามคำขอโดยเร็วที่สุดเพื่อไม่ให้การคำนวณข้อความค้นหาที่ตามมาช้าลง
- ทัศนวิสัย
4. ประวัติโดยย่อของการพัฒนาเครื่องมือค้นหา
ในช่วงเริ่มต้นของการพัฒนาอินเทอร์เน็ต จำนวนผู้ใช้มีน้อย และปริมาณข้อมูลที่มีอยู่ค่อนข้างน้อย โดยส่วนใหญ่แล้ว มีเพียงเจ้าหน้าที่วิจัยเท่านั้นที่สามารถเข้าถึงอินเทอร์เน็ตได้ ช่วงนี้งานค้นหาข้อมูลทางอินเตอร์เน็ตยังไม่เร่งด่วนเหมือนตอนนี้
หนึ่งในวิธีแรก ๆ ในการจัดการการเข้าถึงทรัพยากรข้อมูลเครือข่ายคือการสร้างไดเร็กทอรีแบบเปิดของไซต์ลิงก์ไปยังแหล่งข้อมูลที่จัดกลุ่มตามหัวข้อ โครงการแรกดังกล่าวคือเว็บไซต์ Yahoo.com ซึ่งเปิดในฤดูใบไม้ผลิปี 1994 หลังจากที่จำนวนไซต์ในแค็ตตาล็อกเพิ่มขึ้นอย่างมาก ความสามารถในการค้นหาข้อมูลที่จำเป็นในแค็ตตาล็อกก็ถูกเพิ่มเข้ามา โดยรวมแล้ว มันยังไม่ใช่เครื่องมือค้นหา เนื่องจากพื้นที่การค้นหาถูกจำกัดไว้เฉพาะทรัพยากรที่มีอยู่ในแค็ตตาล็อกเท่านั้น ไม่ใช่ทรัพยากรอินเทอร์เน็ตทั้งหมด
ไดเร็กทอรี Link ถูกใช้กันอย่างแพร่หลายในอดีต แต่ปัจจุบันได้สูญเสียความนิยมไปเกือบทั้งหมดแล้ว เนื่องจากแม้แต่แคตตาล็อกสมัยใหม่ซึ่งมีปริมาณมาก ก็มีข้อมูลเกี่ยวกับอินเทอร์เน็ตเพียงบางส่วนเท่านั้น ไดเรกทอรีที่ใหญ่ที่สุดของเครือข่าย DMOZ (หรือที่เรียกว่า Open Directory Project) มีข้อมูลเกี่ยวกับทรัพยากรประมาณ 5 ล้านรายการ ในขณะที่ฐานข้อมูลเครื่องมือค้นหาของ Google ประกอบด้วยเอกสารมากกว่า 8 พันล้านฉบับ
ในปี 1995 เครื่องมือค้นหา Lycos และ AltaVista ปรากฏขึ้น หลังเป็นผู้นำในด้านการค้นหาข้อมูลบนอินเทอร์เน็ตมาหลายปี
ในปี 1997 เซอร์เกย์ บริน และแลร์รี เพจ ได้สร้างเครื่องมือค้นหาของ Google โดยเป็นส่วนหนึ่งของโครงการวิจัยที่มหาวิทยาลัยสแตนฟอร์ด ปัจจุบัน Google เป็นเครื่องมือค้นหาที่ได้รับความนิยมมากที่สุดในโลก!
ในเดือนกันยายน พ.ศ. 2540 เครื่องมือค้นหายานเดกซ์ซึ่งได้รับความนิยมมากที่สุดบนอินเทอร์เน็ตภาษารัสเซียได้ประกาศอย่างเป็นทางการ
ปัจจุบันมีเครื่องมือค้นหาหลักสามแห่ง (ระหว่างประเทศ) ได้แก่ Google, Yahoo และซึ่งมีฐานข้อมูลและอัลกอริธึมการค้นหาของตนเอง เครื่องมือค้นหาอื่น ๆ ส่วนใหญ่ (ซึ่งมีจำนวนมาก) ใช้ผลลัพธ์จากทั้งสามรายการในรูปแบบใดรูปแบบหนึ่ง ตัวอย่างเช่น การค้นหา AOL (search.aol.com) ใช้ฐานข้อมูลของ Google ในขณะที่ AltaVista, Lycos และ AllTheWeb ใช้ฐานข้อมูล Yahoo
5. องค์ประกอบและหลักการทำงานของระบบค้นหา
ในรัสเซียเครื่องมือค้นหาหลักคือ Yandex ตามด้วย Rambler.ru, Google.ru, Aport.ru, Mail.ru ยิ่งไปกว่านั้น ในขณะนี้ Mail.ru ยังใช้เครื่องมือค้นหาและฐานข้อมูลของ Yandex
เสิร์ชเอ็นจิ้นหลักๆ เกือบทั้งหมดมีโครงสร้างเป็นของตัวเอง แตกต่างจากเสิร์ชเอ็นจิ้นอื่นๆ อย่างไรก็ตาม คุณสามารถระบุองค์ประกอบหลักที่เหมือนกันในเครื่องมือค้นหาทั้งหมดได้ ความแตกต่างในโครงสร้างสามารถอยู่ได้เฉพาะในรูปแบบของการใช้กลไกการโต้ตอบของส่วนประกอบเหล่านี้เท่านั้น
โมดูลการจัดทำดัชนี
โมดูลการจัดทำดัชนีประกอบด้วยโปรแกรมเสริมสามโปรแกรม (หุ่นยนต์):
Spider เป็นโปรแกรมที่ออกแบบมาเพื่อดาวน์โหลดหน้าเว็บ สไปเดอร์จะดาวน์โหลดเพจและดึงลิงก์ภายในทั้งหมดจากหน้านั้น ดาวน์โหลดโค้ด html ของแต่ละหน้าแล้ว โรบ็อตใช้โปรโตคอล HTTP เพื่อดาวน์โหลดเพจ แมงมุมทำงานดังนี้ หุ่นยนต์ส่งคำขอ “get/path/document” และคำสั่งคำขอ HTTP อื่นๆ ไปยังเซิร์ฟเวอร์ ในการตอบสนอง หุ่นยนต์จะได้รับข้อความที่มีข้อมูลการบริการและตัวเอกสารเอง
- URL ของหน้า
- วันที่ดาวน์โหลดเพจ
- ส่วนหัว http การตอบสนองของเซิร์ฟเวอร์
- เนื้อหาของหน้า (โค้ด html)
โปรแกรมรวบรวมข้อมูล (“สไปเดอร์การเดินทาง”) เป็นโปรแกรมที่ติดตามลิงก์ทั้งหมดที่พบในหน้าโดยอัตโนมัติ เลือกลิงก์ทั้งหมดที่มีอยู่ในหน้า หน้าที่ของมันคือการกำหนดว่าสไปเดอร์ควรไปที่ไหนต่อไป โดยอาศัยลิงก์หรือรายการที่อยู่ที่กำหนดไว้ล่วงหน้า โปรแกรมรวบรวมข้อมูลตามลิงก์ที่พบ ค้นหาเอกสารใหม่ที่เครื่องมือค้นหายังไม่รู้จัก
Indexer (ตัวสร้างดัชนีหุ่นยนต์) เป็นโปรแกรมที่วิเคราะห์หน้าเว็บที่ดาวน์โหลดโดยสไปเดอร์ ตัวสร้างดัชนีจะแยกวิเคราะห์เพจออกเป็นส่วนต่างๆ และวิเคราะห์โดยใช้อัลกอริธึมคำศัพท์และสัณฐานวิทยาของตัวมันเอง มีการวิเคราะห์องค์ประกอบต่างๆ ของหน้า เช่น ข้อความ ส่วนหัว ลิงก์ คุณสมบัติโครงสร้างและสไตล์ แท็ก HTML บริการพิเศษ เป็นต้น
ดังนั้น โมดูลการจัดทำดัชนีทำให้คุณสามารถรวบรวมข้อมูลชุดทรัพยากรที่กำหนดโดยใช้ลิงก์ ดาวน์โหลดหน้าที่พบ แยกลิงก์ไปยังหน้าใหม่จากเอกสารที่ได้รับ และดำเนินการวิเคราะห์เอกสารเหล่านี้โดยสมบูรณ์
ฐานข้อมูล
ฐานข้อมูลหรือดัชนีเครื่องมือค้นหาคือระบบจัดเก็บข้อมูล ซึ่งเป็นอาร์เรย์ข้อมูลที่จัดเก็บพารามิเตอร์ที่แปลงเป็นพิเศษของเอกสารทั้งหมดที่ดาวน์โหลดและประมวลผลโดยโมดูลการจัดทำดัชนี
เซิร์ฟเวอร์การค้นหา
เซิร์ฟเวอร์การค้นหาเป็นองค์ประกอบที่สำคัญที่สุดของทั้งระบบ เนื่องจากคุณภาพและความเร็วของการค้นหาขึ้นอยู่กับอัลกอริธึมที่รองรับการทำงานของเซิร์ฟเวอร์โดยตรง
เซิร์ฟเวอร์การค้นหาทำงานดังนี้:
- คำขอที่ได้รับจากผู้ใช้จะต้องได้รับการวิเคราะห์ทางสัณฐานวิทยา สภาพแวดล้อมข้อมูลของแต่ละเอกสารที่มีอยู่ในฐานข้อมูลจะถูกสร้างขึ้น (ซึ่งต่อมาจะแสดงในรูปแบบนั่นคือข้อมูลข้อความที่สอดคล้องกับคำขอในหน้าผลการค้นหา)
- ข้อมูลที่ได้รับจะถูกส่งผ่านเป็นพารามิเตอร์อินพุตไปยังโมดูลการจัดอันดับพิเศษ ข้อมูลได้รับการประมวลผลสำหรับเอกสารทั้งหมด ซึ่งส่งผลให้แต่ละเอกสารมีการให้คะแนนของตัวเองซึ่งระบุลักษณะความเกี่ยวข้องของข้อความค้นหาที่ผู้ใช้ป้อนและส่วนประกอบต่างๆ ของเอกสารนี้ที่จัดเก็บไว้ในดัชนีเครื่องมือค้นหา
- การให้คะแนนนี้สามารถปรับได้ตามเงื่อนไขเพิ่มเติม (เช่น ที่เรียกว่า "การค้นหาขั้นสูง") ทั้งนี้ขึ้นอยู่กับตัวเลือกของผู้ใช้
- จากนั้น จะมีการสร้างตัวอย่างข้อมูล สำหรับแต่ละเอกสารที่พบ ชื่อเรื่อง บทคัดย่อสั้นๆ ที่ตรงกับข้อความค้นหามากที่สุด และลิงก์ไปยังเอกสารนั้นจะถูกแยกออกจากตารางเอกสาร และคำที่พบจะถูกเน้นสี
- ผลลัพธ์การค้นหาจะถูกส่งไปยังผู้ใช้ในรูปแบบของ SERP (หน้าผลลัพธ์ของเครื่องมือค้นหา) - หน้าผลลัพธ์การค้นหา
อย่างที่คุณเห็นส่วนประกอบทั้งหมดเหล่านี้มีความสัมพันธ์กันอย่างใกล้ชิดและทำงานร่วมกันทำให้เกิดกลไกที่ชัดเจนและค่อนข้างซับซ้อนสำหรับการทำงานของระบบการค้นหาซึ่งต้องใช้ทรัพยากรจำนวนมาก
6. บทสรุป
ตอนนี้ขอสรุปทั้งหมดข้างต้น
- เป้าหมายหลักของเครื่องมือค้นหาคือการนำเสนอข้อมูลที่ต้องการแก่ผู้คน
- ลักษณะสำคัญของเครื่องมือค้นหา:
- ความสมบูรณ์
- ความแม่นยำ
- ความเกี่ยวข้อง
- ความเร็วในการค้นหา
- ทัศนวิสัย
- เครื่องมือค้นหาเต็มรูปแบบตัวแรกคือโครงการ WebCrawler ซึ่งเผยแพร่ในปี 1994
- ระบบค้นหาประกอบด้วยส่วนประกอบต่อไปนี้:
- โมดูลการจัดทำดัชนี
- ฐานข้อมูล
- เซิร์ฟเวอร์การค้นหา
เราหวังว่ามาสเตอร์คลาสของเราจะช่วยให้คุณคุ้นเคยกับแนวคิดของเครื่องมือค้นหามากขึ้นและเข้าใจฟังก์ชันหลัก ลักษณะ และหลักการทำงานของเครื่องมือค้นหาได้ดีขึ้น