Search Enging
เสิร์ชเอนจิน (search engine) คือ โปรแกรมที่ช่วยในการสืบค้นหาข้อมูล โดยเฉพาะข้อมูลบนอินเทอร์เน็ต โดยครอบคลุมทั้งข้อความ รูปภาพ ภาพเคลื่อนไหว เพลง ซอฟต์แวร์ แผนที่ ข้อมูลบุคคล กลุ่มข่าว และอื่น ๆ ซึ่งแตกต่างกันไปแล้วแต่โปรแกรมหรือผู้ให้บริการแต่ละราย. เสิร์ชเอนจินส่วนใหญ่จะค้นหาข้อมูลจากคำสำคัญ (คีย์เวิร์ด) ที่ผู้ใช้ป้อนเข้าไป จากนั้นก็จะแสดงรายการผลลัพธ์ที่มันคิดว่าผู้ใช้น่าจะต้องการขึ้นมา ในปัจจุบัน เสิร์ชเอนจินบางตัว เช่น กูเกิล จะบันทึกประวัติการค้นหาและการเลือกผลลัพธ์ของผู้ใช้ไว้ด้วย และจะนำประวัติที่บันทึกไว้นั้น มาช่วยกรองผลลัพธ์ในการค้นหาครั้งต่อ ๆ ไป
ประเภท Search Engine
1. Keyword Index
2. Subject Directories
3. Metasearch Engines
2. Subject Directories
3. Metasearch Engines
1. Keyword Index เป็นการค้นหาข้อมูล โดยการค้นจากข้อความในเว็บเพจที่ได้ผ่านการสำรวจมาแล้ว จะอ่านข้อความ ข้อมูล ประมาณ 200-300 ตัวอักษรแรกของเว็บเพจ วิธีการค้นหาของ Search Engine ประเภทนี้จะให้ความสำคัญกับการเรียงลำดับข้อมูลก่อนหลัง การค้นหาข้อมูล โดยวิธีการเช่นนี้จะมีความรวดเร็วมาก แต่มีความละเอียดในการจัดแยกหมวดหมู่ของข้อมูลค่อนข้างน้อย เนื่องจากไม่ได้คำนึงถึงรายละเอียดของเนื้อหาเท่าที่ควร แต่ถ้าต้องการแนวทางด้านกว้างของข้อมูล การค้นหาแบบนี้จะเหมาะสมที่สุด เว็บที่ให้บริการ Search Engine แบบ Keyword Index ได้แก่เว็บ
2. Subject Directories การจำแนกหมวดหมู่ข้อมูล Search Engine ประเภทนี้ จะจัดแบ่งโดยการวิเคราะห์เนื้อหา ของแต่ละเว็บ เพจ ว่ามีเนื้อหาเกี่ยวกับอะไร โดยการจัดแบ่งแบบนี้จะใช้คนพิจารณาเว็บเพจ แต่ละเว็บ แล้วทำการจัดหมวดหมู่ โดยจะขึ้นอยู่กับวิจารณญาณของคนจัดหมวดหมู่แต่ละคนว่าจะจัดเก็บข้อมูลนั้นๆ อยู่ในกลุ่มของอะไร ดังนั้นฐานข้อมูลของ Search Enginประเภทนี้จะถูกจัดแบ่งตามเนื้อหาก่อน แล้วจึงนำมาเป็นฐานข้อมูลในการค้นหาต่อไป
3. Metasearch Engines จะเป็น Search Engine ที่ใช้ในการค้นหาเว็บ ด้วยตัวของ Search Engine แบบ Metasearch Engines เองแล้ว แต่ที่เด่นกว่านั้นคือ Search Engine แบบ Metasearch Engines จะยังสามารถเชื่อมโยงไปยัง Search Engine ประเภทอื่นๆ เพื่อเรียกดูข้อมูลที่ Search Engine อื่นๆ ค้นพบ โดยสังเกตได้จากจะมีคำว่า [Found on Google, Yahoo!] ต่อทางด้านท้าย นั้นก็หมายความว่าการค้นหาข้อความนั้นๆ มาการเชื่อมโดยไปค้นข้อมูลจาก เว็บ Google และ Yahoo
แต่การค้นหาด้วยวิธีนี้มีจุดด้อย คือ วิธีการนี้จะไม่ให้ความสำคัญกับขนาดเล็กใหญ่ของตัวอักษรและมักจะไม่ค้นหาคำประเภท Natural Language (ภาษาพูด) และที่สำคัญ Search Engine แบบ Metasearch Engines ส่วนมากไม่รองรับภาษาไทย
การทำงานของ Search Engine ประกอบไปด้วย ๓ ส่วนหลัก ๆ คือ
๑. Spider หรือ Web Robot จะเป็นตัวที่ทำหน้าที่เข้าสำรวจเว็บไซต์ต่างๆ แล้วดึงข้อมูลเหล่านั้นมาอัพเดทใส่ในรายการฐานข้อมูล ส่วนมาก Spider มักจะเข้าไปอัพเดทข้อมูลเป็นรายเดือ
๒. ฐานข้อมูล (Database) เป็นส่วนที่เก็บรายการเว็บไซต์ ฐานข้อมูลที่ดีควรจะมีขนาดใหญ่เพียงพอที่จะรองรับกับการเติบโตของเว็บไซต์ในปัจจุบัน การออกแบบฐานข้อมูลที่ดีก็เป็นส่วนสำคัญเพราะถ้าฐานข้อมูลออกแบบมาทำงานช้าก็ทำให้การรอผลนานและจะไม่ได้รับความนิยมไปในที่สุด
๓.โปรแกรม Search Engine มีหน้าที่รับคำหรือข้อความที่ผู้ใช้งานป้อนเข้ามา แล้วเข้าค้นหาตามเว็บไซต์ต่างๆ ที่จัดเก็บไว้ในฐานข้อมูล จากนั้นก็จะรายงานผลเว็บไซต์ที่ค้นพบให้กับผู้ใช้ การสืบค้นด้วยวิธีนี้นอกจากจะต้องมีระบบการสืบค้นข้อมูลที่รวดเร็วและมีประสิทธิภาพแล้ว การกลั่นกรองผลที่ได้ เพื่อให้ตรงกับความต้องการของผู้ใช้ก็เป็นอีกส่วนหนึ่งที่สำคัญของการสืบค้นข้อมูล
ดังนั้น การเลือกใช้เครื่องมือในการค้นหาจะต้องเข้าใจว่า ข้อมูลที่ต้องการค้นหานั้นมีลักษณะอย่างไร มีขอบข่ายกว้างขวางหรือแคบขนาดไหน แล้วจึงเลือกใช้เว็บไซต์ค้นหาที่ให้บริการตรงกับความต้องการ
ตัวอย่าง Search Engine ที่นิยมใช้มีทั้งเว็บไซต์ที่เป็นของต่างประเทศ และของไทยเอง ตัวอย่างเว็บไซต์ของต่างประเทศ ได้แก่ http://www.yahoo.com http://www.google.com http://www.infoseek.com http://www.ultraseek.com http://www.lycos.com http://www.excite.com http://www.altavista.digital.com http://www.opentext.com http://www.hotbot.com http://www.webcrawler.com http://www.dejanews.com http://www.elnet.net สำหรับเว็บไซต์ของไทย ได้แก่ http://www.sanook.com http://www.siamguru.com
บทสรุป ปัจจุบัน เป็นยุคของข้อมูลและข่าวสาร ดังนั้น Search Engine จึงมีประโยชน์มากต่อผู้ที่ใช้อินเตอร์เน็ตเพื่อค้นหาข้อมูลและโดยเฉพาะ อย่างยิ่งผู้ที่ต้องการให้ข้อมูลบนอินเตอร์เน็ต โดยที่ Search Engine ทำหน้าที่เป็นแหล่งที่ให้ข้อมูลที่ได้จากการเก็บและรวบรวมข้อมูลที่มีอยู่ใน เว็บไซด์ต่างๆ ซึ่งช่วยประหยัดเวลาในการค้นหา แต่เนื่องจากการที่มีผู้ใช้อินเตอร์เน็ตเพิ่มขึ้นเป็นทวีคูณ ในแต่ละปี จึงทำให้ธุรกิจบนอินเตอร์เน็ตเป็นตลาดการค้าเสรีไร้พรมแดนที่ใหญ่มากและมี การแข่งขันสูง ดังนั้นจึงมีหลายเว็บไซด์ที่พยายามหาทางทำให้เว็บไซด์ของตนติดอันดับต้นๆ เพื่อผลประโยชน์ส่วนตน โดยเจตนาทำ Spam เพื่อให้ข้อมูล ที่ไม่เป็นจริงหรือเกินความจริงกับ Spider ในการจัดทำฐานข้อมูลของ Search Engine อย่างไรก็ตามผู้ใช้อินเตอร์เน็ตไม่ต้องกังวลเรื่อง Spam มากนักเพราะว่า Search Engine หลายแห่งมีความสามารถในการตรวจ Spam ประเภทต่างๆ ได้ จะต่างกันก็ตรงที่ Search Engine แต่ละแห่งอาจจะเข้มงวดกับเรื่องของการ Spam ไม่เท่ากัน โดยที่เทคนิคการ Spam บางอย่างอาจไม่เป็นที่ยอมรับได้ใน Search Engine หนึ่ง แต่อาจจะทำให้เว็บไซต์ยังติดอันดับอยู่ใน Search Engine อีกแห่งหนึ่ง ดังนั้นถ้าคุณ รู้สึกว่าไม่ยุติธรรมกับการที่คู่แข่งใช้เทคนิคพวกนี้ มาเอาเปรียบคุณ สิ่งที่คุณควรทำ ไม่ใช่โกงตามเค้า แต่ให้ email แจ้งไปที่ editor ของ Search Engine ได้เลย เพราะ Search Engine ทุกแห่งพร้อมรับแจ้งปัญหาลักษณะนี้อยู่แล้ว เพียงแต่คุณต้องตรวจดู ให้แน่ชัดว่าเป็นการ Spam จริงๆ (ไม่ใช่มาใส่ร้ายกัน) และควรระบุจุดปัญหาที่เจอไปด้วย เพื่อว่าทาง editor จะได้ดำเนินการได้เร็วขึ้น