Sebelum ada CAPTCHA, spammer/hacker
dapat membuat program untuk secara otomatis mengisi formulir seperti
pendaftaran email gratis, sehingga ia akan memperoleh ribuan alamat
email dengan mudah untuk kemudian disalah-gunakan. Atau untuk mengubah
hasil sebuah polling online, seseorang bisa saja membuat program
sederhana untuk mengisi polling tersebut dengan jawaban yang sama
sebanyak ribuan atau bahkan jutaan kali. Akibatnya polling itu tentu
saja menjadi tidak valid.
Untuk mencegah program seperti itu,
kini semua formulir akan menampilkan CAPTCHA berupa gambar huruf-huruf
bengkok atau saling menyambung yang sukar dibaca oleh program atau
komputer, namun (relatif) mudah dibaca manusia. Jika isian dari pengisi
formulir sesuai dengan gambar yang ditampilkan, maka kemungkinan besar
pengisi formulir adalah seorang manusia, bukan program komputer.
CAPTCHA
biasanya dibuat secara otomatis secara acak setiap kali ada orang yang
masuk halaman formulir di web, sehingga hampir tidak ada dua CAPTCHA
yang serupa. Ini membuat jumlah kombinasi yang mungkin muncul
sangat-sangat banyak, sehingga hampir tidak mungkin untuk membuat
program yang mampu mengingat dan menjawab CAPTCHA yang akan muncul.
Selain
CAPTCHA visual yang sering kita jumpai, ada juga versi audio bagi
penyandang cacat mata, dengan prinsip yang kurang lebih sama.
Saat
ini ada inisiatif untuk memanfaatkan CAPTCHA untuk tujuan positif.
Untuk menyelamatkan arsip-arsip penting didunia, di banyak negara kini
ada pihak yang bertanggung jawab untuk mengubah format arsip yang sudah
ada (buku, dokumen tercetak) ke format digital (file komputer). Dua
kendala utama yang muncul adalah banyaknya jumlah arsip yang tersimpan
selama ratusan tahun, serta kualitas cetakan yang buruk sehingga hasil
scan-nya sukar dikenali oleh komputer. Dengan gabungan kedua kendala
itu, hampir tidak mungkin membayar tenaga manusia untuk membaca secara
manual arsip yang gagal dibaca komputer.
Untuk mengatasinya kini
muncul re-CAPTCHA, sebuah sistem yang bekerja sama dengan Google Books
dan The Internet Archive, dimana hasil scan arsip yang gagal dibaca
komputer dimunculkan sebagai CAPTCHA, lalu hasil isian itu dianggap
sebagai teks yang hilang/tak terbaca. Agar yakin teks itu benar,
biasanya tidak hanya satu jawaban yang dipakai, melainkan hingga sepuluh
atau lebih jawaban yang sama.
Ini menjadi solusi win-win bagi
semua pihak. Bagi pemilik web dengan formulir, ia mendapat CAPTCHA yang
sudah tidak bisa dikenali oleh komputer super canggih yang dipakai untuk
proses digitalisasi arsip, sehingga hacker juga kesulitan membuat
program yang mampu membacanya. Dan bagi pihak pengubah format arsip,
dengan begitu banyaknya formulir yang diisi diseluruh dunia tiap
harinya, re-CAPTCHA dapat membantu digitalisasi arsip dengan cepat dan
gratis.
Jadi saat mengisi formulir di website yang bekerja
sama dengan re-CAPTCHA, Anda sudah turut membantu menyelamatkan arsip
dunia bagi anak cucu kita semua nanti.
Sayangnya setelah
diimplementasikan sekian tahun, sistem CAPTCHA sudah mulai menunjukkan
beberapa kelemahan. Perkembangan hardware dan software membuatnya tidak
lagi terlalu sukar untuk dipecahkan oleh program. Apalagi kini muncul
perusahaan-perusahaan atau layanan decaptcher di dunia ketiga yang
bersedia memecahkan CAPTCHA dengan biaya yang sangat murah.
DeCaptcher.com bersedia memecahkan CAPTCHA dengan hanya US$2 per 1000
CAPTCHA. Untuk mengatasinya, saat ini beberapa pihak seperti Universitas
Carnegie Mellon dan Penn State sedang mengembangkan CAPTCHA yang
berbasis gambar, bukan lagi huruf.
Penjelasan ReCaptcha menurut Google sebagai berikut.
- reCAPTCHA adalah sebuah
fasilitas internet yang membantu untuk mendigitalkan buku-buku, surat
kabar maupun siaran radio lawas..berupa 'teks tedistorsi' dimana kita
harus mengetik teks tersebut untuk menjalankan perintah.
- Sebuah CAPTCHA adalah program yang
dapat memberitahu apakah user adalah seorang 'manusia asli' atau 'script
komputer yang sudah diprogram'.
- CAPTCHA digunakan banyak website
untuk mencegah penyalahgunaan dari "bot" atau program otomatis yang
biasanya ditulis untuk menghasilkan pesan-pesan spam pada internet.
- Tidak ada program komputer yang
dapat membaca teks terdistorsi sebaik mata manusia, sehingga bot tidak
akan dapat menavigasi situs yang dilindungi oleh CAPTCHA
Dari situ diketahui bahwa salah satu
fungsi reCAPTCHA adalah untuk mendigitalisasikan buku-buku pengetahuan
bersejarah yang diterbitkan sebelum adanya komputer..
Bagaimana prosesnya digitalisasinya?
Penjelasan ada di bawah ini..
Mula-mula, buku yang ingin didigitalisasikan discan dulu menggunakan scanner..
Setelah discan, gambar yang dihasilkan diubah menjadi teks komputer menggunakan software Optical Character Recognition (OCR)..
masalahnya disini, hasil OCR
belum tentu perfect..masih ada sebagian kata yang belum bisa
diterjemahkan.. Naahh..saat inilah program reCAPTCHA dibutuhkan..
reCAPTCHA membantu proses
digitalisasi buku dengan mengirim kata-kata yang tidak dapat dibaca oleh
komputer ke Web dalam bentuk CAPTCHA untuk diuraikan sendiri oleh
manusia.
Lebih jelas lagi, setiap kata yang tidak bisa dibaca dengan
benar oleh OCR akan ditempatkan pada gambar dan digunakan sebagai
CAPTCHA. Hal ini dimungkinkan karena sebagian besar program OCR
memberitahukan Anda bila kata tidak dapat dibaca dengan benar.
Lalu jika memang teks tersebut tidak
bisa terbaca, lantas bagaimana sistem CAPTCHA mengetahui bahwa teks yang
diketik user pada CAPTCHA itu benar/salah?..
Caranya adalah dengan
menggunakan 2 kata pada setiap captcha. Kata pertama adalah kata yang
memang sudah terbaca pada OCR, sedangkan kata kedua adalah kata yang
belum terbaca.
0 komentar:
Posting Komentar