Sebuah Cerita Sistem CAPTCHA Yang Perlahan-lahan Menjadi Sangat Sulit Dipecahkan

Tahun lalu, permintaan Google yang terus-menerus untuk membuktikan seseorang adalah manusia mulai terasa semakin agresif. Semakin banyak, tombol sederhana yang agak terlalu lucu bertuliskan “Saya bukan robot” diikuti oleh tuntutan untuk membuktikannya – dengan memilih semua lampu lalu lintas, penyeberangan, dan etalase dalam kisi gambar.
Seringnya kita memilih lampu lalu lintas terkubur di dedaunan yang jauh, penyeberangan melengkung dan setengah di sekitar sudut, papan nama etalase buram dan dalam bahasa Korea. Ada sesuatu yang unik dan mengecewakan saat diminta untuk mengidentifikasi hidran kebakaran dan kita kesulitan untuk melakukannya.
Tes unik ini disebut CAPTCHA, singkatan dari Completely Automated Public Turing test to tell Computers and Humans Apart, dan tes ini telah berubah menjadi sangat sulit daripada awalnya. Di awal tahun 2000-an, gambar teks sederhana sudah cukup untuk membuat kebanyakan robot spam bingung. Tetapi satu dekade kemudian, setelah Google membeli program dari peneliti Carnegie Mellon dan menggunakannya untuk mendigitalkan Google Book, teks harus semakin dibengkokkan bentuknya dan dikaburkan agar tetap terdepan dalam meningkatkan program pengenalan karakter optik.
Karena CAPTCHA adalah alat yang elegan untuk melatih AI, pengujian apa pun hanya dapat bersifat sementara, sesuatu yang diakui oleh penemunya sejak awal. Dengan semua peneliti, scammer, dan manusia biasa yang memecahkan miliaran teka-teki tepat di ambang apa yang dapat dilakukan AI, pada titik tertentu mesin akan melewati kita. Pada tahun 2014, Google mencoba mengadu salah satu algoritma pembelajaran mesinnya dengan manusia dalam memecahkan teks CAPTCHA yang paling terdistorsi, hasilnya adalah komputer mendapatkan tes dengan benar 99,8 persen dari waktu, sementara manusia hanya mendapatkan 33 persen.
Google kemudian pindah ke NoCaptcha ReCaptcha, yang mengamati data dan perilaku pengguna untuk membiarkan beberapa orang melewatinya dengan mengeklik tombol “Saya bukan robot”, dan memberi orang lain pelabelan gambar yang kita lihat sekarang. Tapi mesin sekali lagi mengejar. Semua awning yang mungkin atau mungkin bukan etalase? Mereka adalah akhir dari perlombaan senjata umat manusia dengan mesin.
Jason Polakis, seorang profesor ilmu komputer di University of Illinois di Chicago, secara pribadi memuji peningkatan kesulitan CAPTCHA baru-baru ini. Pada tahun 2016, dia menerbitkan makalah di mana dia menggunakan alat pengenalan gambar siap pakai, termasuk penelusuran gambar terbalik milik Google, untuk menyelesaikan CAPTCHA gambar Google dengan akurasi 70 persen. Peneliti lain telah memecahkan tantangan CAPTCHA audio Google menggunakan program pengenalan audio milik Google sendiri.
Pembelajaran mesin sekarang sama baiknya dengan manusia dalam tugas pengenalan teks, gambar, dan suara dasar, kata Polakis. Faktanya, algoritme mungkin lebih baik dalam hal ini: “Kami berada pada titik di mana mempersulit perangkat lunak akan membuat terlalu sulit bagi banyak orang. Kami membutuhkan beberapa alternatif, tetapi belum ada rencana konkret. “

Literatur tentang CAPTCHA dipenuhi dengan permulaan yang salah dan upaya aneh untuk menemukan sesuatu selain pengenalan teks atau gambar yang dimiliki oleh manusia secara universal dan perjuangan mesin. Peneliti telah mencoba meminta pengguna untuk mengklasifikasikan gambar orang berdasarkan ekspresi wajah, jenis kelamin, dan etnis. (Anda dapat membayangkan seberapa baik itu berjalan.) Ada proposal untuk CAPTCHA trivia, dan CAPTCHA berdasarkan sajak anak-anak yang umum di daerah di mana pengguna konon dibesarkan.
CAPTCHA berdasarkan budaya semacam itu ditujukan tidak hanya untuk bot, tetapi juga untuk manusia yang bekerja di peternakan CAPTCHA di luar negeri yang memecahkan teka-teki dengan harga sepersekian sen. Orang-orang telah mencoba menghalangi pengenalan gambar dengan meminta pengguna untuk mengidentifikasi, katakanlah, babi, tetapi membuat kartun babi dan memberi mereka kacamata hitam. Para peneliti telah meminta pengguna untuk mengidentifikasi objek di bercak seperti Mata Ajaib. Dalam variasi yang menarik, para peneliti pada tahun 2010 mengusulkan penggunaan CAPTCHA untuk mengindeks petroglif kuno, namun komputer tidak terlalu pandai mengartikan sketsa gestur rusa yang digoreskan di dinding gua.
Baru-baru ini ada upaya untuk mengembangkan CAPTCHA seperti game, tes yang mengharuskan pengguna untuk memutar objek ke sudut tertentu atau memindahkan potongan puzzle ke posisinya, dengan instruksi yang diberikan bukan dalam teks tetapi dalam simbol atau tersirat oleh konteks papan game. Harapannya adalah bahwa manusia akan memahami logika teka-teki itu, tetapi komputer, yang tidak memiliki instruksi yang jelas, akan buntu. Peneliti lain telah mencoba mengeksploitasi fakta bahwa manusia memiliki tubuh, menggunakan kamera perangkat atau augmented reality untuk bukti interaktif kemanusiaan.
Masalah dengan banyak dari tes ini bukanlah karena bot itu terlalu pintar – manusia tidak tahu apa-apa. Dan bukan berarti manusia itu bodoh; manusia sangat beragam dalam bahasa, budaya, dan pengalaman. Setelah Anda menyingkirkan semua hal itu untuk membuat tes yang dapat dilalui oleh setiap manusia, tanpa pelatihan sebelumnya atau banyak pemikiran, Anda ditinggalkan dengan tugas-tugas kasar seperti pemrosesan gambar, tepatnya hal yang akan dilakukan oleh AI yang dibuat khusus.
“Tes dibatasi oleh kemampuan manusia,” kata Polakis. “Tidak hanya kemampuan fisik kami, Anda membutuhkan sesuatu yang [dapat] lintas budaya, lintas bahasa. Anda memerlukan beberapa jenis tantangan yang berhasil dengan seseorang dari Yunani, seseorang dari Chicago, seseorang dari Afrika Selatan, Iran, dan Australia pada saat yang sama. Dan itu harus terlepas dari seluk-beluk dan perbedaan budaya. Anda membutuhkan sesuatu yang mudah bagi manusia pada umumnya, itu tidak boleh terikat pada subkelompok orang tertentu, dan itu harus sulit untuk komputer pada saat yang sama. Itu sangat membatasi apa yang sebenarnya dapat Anda lakukan. Dan itu harus menjadi sesuatu yang dapat dilakukan manusia dengan cepat, dan tidak terlalu mengganggu. “