Popular Posts

Blogger news

Blogroll

Blog Archive

Selasa, 17 Maret 2015
Nama/NIM : IB Wahyu Sastra Dipa / 1204505050
Jurusan/Fakultas/Perguruan Tinggi : Teknologi Informasi/ Fakultas Teknik/ Universitas Udayana
Matakuliah : Sistem Temu Kembali Informasi
Dosen : I Putu Agus Eka Pratama, ST.,MT.

bagaimana prioritas pencarian dalam IR?

Pada dasarnya, semua search engine beroperasi dengan basic yang sama yaitu 3 buah perintah dasar. Ketiga perintah ini adalah web crawling, pemberian indeks (indexing), dan pencarian (searching).

Setiap operasi ini merupakan elemen yang penting dan krusial pada setiap search engine untuk meningkatkan performansinya, yaitu recall dan presisi.

Web crawler adalah program computer yang melakukan penelusuran terhadap world wide web dan menyimpan informasi-informasi yang ada pada suatu storage dengan teratur.


Web crawler bekerja dengan arsitektur seperti gambar dibawah ini.

Setelah data disimpan pada storage, search engine akan melakukan indexing yaitu mengumpulkan,mengelompokkan, dan menyimpan data dengan lebih teratur sehingga dapat memfasilitasi proses pencarian pada search engine oleh pengguna dengan lebih cepat dan efektif.


Setelah informasi dikelompokkan dan disimpan dengan teratur, proses search engine yang terakhir adalah melakukan pencarian terhadap informasi yang dibutuhkan berdasarkan kata kunci yang dimasukkan.


Search engine akan memprioritaskan kata-kata tertentu dibandingkan kata-kata lain (misalnya tidak secara khusus mencari semua informasi yang mengandung kata-kata preposisi pada query, dll).
Terdapat 8 hal dasar yang umumnya digunakan oleh search engine untuk mendasari pengurutan tingkat relevansi suatu informasi pada halaman web.

1. Keyword pada domain name
Domain name menjadi prioritas dari pencarian relevansi suatu pencarian karena suatu domain name dianggap mewakili keseluruhan isi dari website itu sendiri. Selain itu, domain name adalah hal pertama yang ditelusuri oleh suatu search engine.
2. Keyword pada nama file
Seperti halnya pada halaman web, nama file pada dokumen yang ada adalah hal yang pertama kali ditelusuri pada dokumen sebelum isi dokumen itu.
Setelah domain name dan nama file, keyword pada page title juga sangat mempengaruhi pada pencarian informasi yang relevan dengan query
4. Keyword pada headline
Headline terutama pada berita merupakan gambaran umum dari isi informasi.
5. Keyword yang relevan pada meta tag
6. Keyword pada page content
Isi informasi dari suatu halaman dapat ditelusuri pada page content
7. Meta tags atau tag-tag HTML khusus yang digunakan untuk menggambarkan keseluruhan dari isi website
8. Link Popularity
Dengan tingginya popularitas suatu halaman web, search engine akan menganggap bahwa halaman tersebut cenderung relevan dengan kebanyakan informasi yang diharapkan.


refrensi
http://en.wikipedia.org/wiki/Index_%28search_engine%29
Gita Desrianti.2010.Akurasi dalam Pencarian pada Search Engines


0 komentar: