Bagaimana definisi search engine dan cara kerjanya?

Search engine adalah program komputer yang dirancang untuk membantu seseorang untuk menemukan file-file yang disimpan dalam sebuah komputer, misalnya dalam sebuah server umum di world wide web (WWW) atau di pada stand alone computer (Ledford, 2007).

Search engine memungkinkan user untuk meminta content media dengan kriteria spesifik, yang biasanya berisi kata atau frase yang ditentukan. Dan memperoleh daftar file yang memenuhi kriteria tersebut.

Search engine biasanya menggunakan indeks untuk mencari file setelah pengguna memasukkan kriteria pencarian.

Dalam ranah web dan internet, search engine biasanya merujuk pada WWW dan bukan protocol maupun area lainnya. Selain itu, search engine mengumpulkan data yang tersedia dari newsgroup, database besar, atau direktori terbuka seperti DMOZ.org. Karena pengumpulan datanya dilakukan secara otomatis, search engine berbeda dengan direktori web yang dikerjakan oleh manusia.

Sebagian besar search engine dijalankan oleh swasta yang menggunakan algoritma kepemilikan dan database tertutup. Yang paling populer adalah Google, dan diikuti oleh MSN Search dan Yahoo! di belakangnya. Saat ini juga telah ada beberapa search engine yang berbasis open source, contohnya antara lain Htdig, Nutch, Egothor, dan OpenFTS (Arin, 2009).

Cara Kerja
Search engine berbasis web bekerja dengan cara menyimpan informasi tentang halaman-halaman web yang diambil langsung dari WWW. Halaman- halaman tersebut diambil dengan web crawler, browser web otomatis yang mengikuti setiap link yang dilihatnya. Isi setiap halaman lalu dianalisis untuk menentukan cara mengindeksnya. Misalnya, kata-kata diambil dari judul, sub judul, atau field khusus yang disebut sebagai meta tag. Data tentang halaman web dibandingkan dengan mesin-mesin seperti milik Google, jenis mesin ini memiliki beberapa keunggulan dalam beberapa hal, seperti informasi yang selalu mutakhir, hampir tidak terdapat link yang mati, dan lebih sedikit sumber daya sistem yang diperlukan (Arin, 2009).

Sebagai perbandingan, Google menggunakan hampir 100.000 unit komputer, sedangkan Orase hanya menggunakan 1 unit saja. Tetapi tentu saja jenis mesin yang terakhir ini memiliki kelemahan dalam hal waktu yang dihabiskan untuk proses pencarian.