Searching juga bisa diartikan adalah proses pencarian data dari
sekumpulan data yang sudah ada. Pencarian data sering juga disebut
dengan table look-up atau store and retrieval information. Hasil dari
suatu pencarian dapat bernilai salah (tidak ketemu atau tidak sukses)
atau benar (ketemu atau sukses). Untuk data yang tidak ketemu biasanya
ada prosedur tersendiri untuk menambah atau menyisipkan data yang belum
ada tersebut.
Pencarian
biner merupakan salah satu cara atau metode untuk melaksanakan proses
pencarian. Cara ini merupakan cara yang paling cepat di antara
metode-metode yang lainnya. Metode pencarian biner dapat dijelaskan
sebagai berikut. Pertama-tama data-data yang sduah ada harus diurutkan
dahulu. Selanjuutnya data yang sudah diurutkan tadi disebut sebagai
vektor. Kemudian vektor tadi dibagi menjadi dua subvektor yang memiliki
jumlah elemen yang sama, kemudian data yang dicari dibandingkan dengan
data terakhir dari subvektor pertama. Jika data tersebut lebih kecil
maka berarti data kemungkinan ada di subvektor pertama, sehingga
pencarian dapat dilakukan di subvektor pertama dengan terlebih dahulu
membagi subvektor tadi menjadi dua subvektor. Jika lebih besar maka
berarti data kemungkinan ada di subvektor kedua, sehingga pencarian
dapat dilakukan di subvektor kedua dengan terlebih dahulu menbagi
subvektor tadi menjadi dua subvektor.
Cara Kerja
Cara kerja mesin pencari
Mesin pencari web
bekerja dengan cara menyimpan informasi tentang banyak halaman web,
yang diambil langsung dari WWW. Halaman-halaman ini diambil dengan web
crawler — browser web otomatis yang mengikuti setiap pranala/link yang
dilihatnya. Isi setiap halaman lalu dianalisis untuk menentukan cara
indeks-nya (misalnya, kata-kata diambil dari judul, subjudul, atau field
khusus yang disebut meta tag). Data tentang halaman web disimpan dalam
sebuah database indeks untuk digunakan dalam pencarian selanjutnya.
Sebagian mesin pencari, seperti Google, menyimpan seluruh atau sebagian
halaman sumber (yang disebut cache) maupun informasi tentang halaman web
itu sendiri.
Selain halaman
web, Mesin pencari juga menyimpan dan memberikan informasi hasil
pencarian berupa pranala yang merujuk pada file, seperti file audio,
file video, gambar, foto dan sebagainya, serta informasi tentang
seseorang, suatu produk, layanan, dan informasi beragam lainnya yang
semakin terus berkembang sesuai dengan perkembangan teknologi informasi.
Ketika seseorang
mengunjungi mesin pencari dan memasukkan query, biasanya dengan
memasukkan kata kunci, mesin mencari indeks dan memberikan daftar
halaman web yang paling sesuai dengan kriterianya, biasanya disertai
ringkasan singkat mengenai judul dokumen dan kadang-kadang sebagian
teksnya.
Ada jenis mesin
pencari lain: mesin pencari real-time, seperti Orase. Mesin seperti ini
tidak menggunakan indeks. Informasi yang diperlukan mesin tersebut hanya
dikumpulkan jika ada pencarian baru. Jika dibandingkan dengan sistem
berbasis indeks yang digunakan mesin-mesin seperti Google, sistem
real-time ini unggul dalam beberapa hal: informasi selalu mutakhir,
(hampir) tak ada pranala mati, dan lebih sedikit sumber daya sistem yang
diperlukan. (Google menggunakan hampir 100.000 komputer, Orase hanya
satu.) Tetapi, ada juga kelemahannya: pencarian lebih lama rampungnya.
Manfaat mesin
pencari bergantung pada relevansi hasil-hasil yang diberikannya.
Meskipun mungkin ada jutaan halaman web yang mengandung suatu kata atau
frasa, sebagian halaman mungkin lebih relevan, populer, atau autoritatif
daripada yang lain. Kebanyakan mesin pencari menggunakan berbagai
metode untuk menentukan peringkat hasil pencarian agar mampu memberikan
hasil “terbaik” lebih dahulu. Cara mesin menentukan halaman mana yang
paling sesuai, dan urutan halaman-halaman itu diperlihatkan, sangat
bervariasi. Metode-metode nya juga berubah seiring waktu dengan
berubahnya penggunaan internet dan berevolusinya teknik-teknik baru.
Sebagian besar
mesin pencari web adalah usaha komersial yang didukung pemasukan iklan
dan karenanya sebagian menjalankan praktik kontroversial, yaitu
membolehkan pengiklan membayar agar halaman mereka diberi peringkat
lebih tinggi dalam hasil pencarian.
Proses Pencarian
Melakukan
pencarian dokumen yang dimuat pada suatu situs bisa begitu mudah dan
kelihatannya mungkin sulit juga. apalagi mengignat begitu menyebarnya
informasi dimana-mana, bahkan University of Calofornia menyebutkan saat
ini telah terdapat lebih dari 50 milyar halaman web di internet,
meskipun tidak ada ada satupun yang benar-benar tahu jumlah persisnya.
kesulitan yang
mungkin terjadi adalah karena WWW tersebut tidak terdata dalam bentuk
yang terstandardisasi isinya. tidak sama halnya dengan katalog yang ada
di perpustakaan, yang memiliki standardisasi secara mendunia berdasarkan
subjek dari judul buku, meskipun jumlahnya juga tidak sedikit.
Dalam pencarian
di web, pengguna selalu memperkirakan kata apa yang di kira-kira
terdapat pada halaman yang ingin anda temukan. atau kira-kira apa subjek
yang dipilih oleh seseorang untuk mengelolah halaman situs yang mereka
kelola, topik apa saja kira-kira yang di bahas.
Jika pengguna
melakukan apa yang dikenal dengan pencarian pada halaman web, sebenarnya
tidaklah melakukan pencarian. tidak mungkin melakukan pencarian di WWW
secara langsung.
Pada web
benar-benar terdiri dari banyak sekali halaman web yang ingin disimpan
dari berbagai server diseluruh dunia. Komputer pengguna tidak langsung
melakukan pencarian kepada seluruh komputer tersebut secara langsung.
Apa yang mungkin
pengguna lakukan hanyalah melalui komputer untuk mengakses satu atau
lebih perantara yang disebut dengan alat bantu pencarian yang ada saat
ini. Melakukan pencarian pada alat bantu itu tadi ke database yang
dimiliki. data base tersebut mengkoleksi situs-situs yang ditemukan dan
simpan.
alat bantu
pencarian ini menyediakan hasil pencarian dalam bentuk hypertext link
dengan URL menuju halaman lainnya. ketika anda klik link ini, dan menuju
ke alamat tersebut maka dokumen, gambar, suara dan banyak lagi bentuk
lainnya yang ada pada server tersebut disediakan, sesuai dengan
informasi yang terdapat di dalamnya. layanan ini bisa menjangkau ke
manapun di seluruh dunia.
Prinsip Umum Dari mesin pencari
Sistem kinerja
mesin ini ada beberapa hal yang perlu di perhatikan terutama
keterkaitannya dengan masalah arsitekrut dan mekanismenya.
Spider
Merupakan program
yang men-download halaman-halaman yang mereka temukan, mirip dengan
browser. Perbedannya adalah bahwa browser menapilkan secara langsung
informasi yang ada (baik tekas, gambar, dll). Untuk kepentingan manusia
yang menggunakannya pada saat itu, sedangkan spider tidak melakukan
untuk menampilkan dalam bentuk yang terlihat seperti itu, karena
kepentingannya adalah untuk mesin, bukan untuk manusia, spider pun
dijalankan oleh mesin secara otomatis. Kepentingannya adalah untuk
mengambil halaman-halaman yang dikunjunginya untuk disimpan kedalam
database yang dimiliki oleh search engine.
Crawler
Merupakan program
yang dimiliki search engine untuk melacak dan menemukan link yang
terdapat dari setiap halaman yang ditemuinya. Tugasnya adalah untuk
menentukan spoder harus pergi kemana dan mengevaluasi link berdasarkan
alamat yang ditentukan dari awal. Crawler mengikuti link dan mencoba
menemukan dokumen yang belum dikenal oleh search engine.
Indexer
Komponen ini
melakukan aktifitas untuk menguraikan masing-masing halaman dan meneliti
berbagai unsur, seperti teks, headers, struktur atau fitur dari gaya
penulisan, tag HTML khusus, dll.
Database
Merupakan tempat
standar untuk menyimpan data-data dari halaman yang telah dikunjungi,
di-download dan sudah dianalisis. kadang kala disebut juga dengan index
dari suatu search engine.
Result Engine
Mesin yang
melakukan penggolongan dan penentuan peringkat dari hasil pencarian pada
search engine. Mesin ini menentukan halaman mana yang menemui kriteria
terbaik dari hasil pencarian berdasarkan permintaan penggunanya, dan
bagaimana bentuk penampulan yang akan ditampilkan.
Proses ini
dilaksanakan berdasarkan algoritma perangkingan yang dimiliki oleh
search engine tersebut, mengikuti kaidah perangkingan hakaman yang
dipergunakan oleh mereka adalah hak mereka, para peneliti mempelajari
sifat-sifat yang mereka gunakan, terutama untuk meningkatkan pencarian
yang dihasilkan oleh serach engine tersebut.
Web Server
Merupakan
komponen yang melayani permintaan dan memberikan respon balik dari
permintaan tersebut. Web Server ini biasanya menghasilkan informasi atau
dokumen dalam format HTML. Pada halaman tersebut tersedia layanan untuk
mengisikan kata kunci pencarian yang diinginkan oleh usernya. Web
Server ini juga bertanggung jawab dalam menyampaikan hasil pencarian
yang dikirimkan kepada komputer yang meminta informasi.
Tidak ada komentar:
Posting Komentar