ChatGPT Kalah Telak dari Mesin Catur Tahun 1970-an, Jadi Bahan Tertawaan di Medsos
Seorang ilmuwan membuktikan masih adanya kekurangan ChatGPT dengan mesin jadul tahun 1970-an.
Eksperimen unik yang dilakukan seorang insinyur teknologi membuktikan bahwa ChatGPT, model bahasa canggih besutan OpenAI, masih memiliki kelemahan serius: ia kalah telak dari mesin catur klasik Atari 2600 yang dirilis pada 1970-an.
Dalam unggahan di LinkedIn, Robert Jr. Caruso, engineer di Citrix, menceritakan pengalamannya “memaksa” ChatGPT bermain catur melawan program Atari Chess—sebuah game lawas dengan kemampuan prediksi hanya satu hingga dua langkah ke depan, dijalankan pada prosesor 1,19 MHz. Hasilnya mengejutkan sekaligus memalukan bagi AI modern: ChatGPT kalah telak.
Menurut Caruso, ChatGPT berulang kali melakukan kesalahan fatal, termasuk salah mengenali posisi bidak, gagal membaca serangan sederhana seperti pawn fork, dan bahkan kebingungan membedakan benteng dan gajah.
“ChatGPT benar-benar hancur di level pemula,” tulis Caruso dikutip dari IFLScience, Rabu (9/7).
Bahkan setelah pindah dari papan Atari bergrafik rendah ke notasi catur standar, performanya tak membaik. ChatGPT beberapa kali meminta memulai ulang dengan janji “bermain lebih baik,” tapi akhirnya harus menyerah.
Atari Chess sendiri dirancang khusus untuk bermain catur. Meski dibangun dengan teknologi sangat terbatas dibanding komputer modern, program itu memiliki algoritma yang terfokus untuk satu tugas. Ini membuatnya tetap mampu memprediksi langkah lawan dan mencegah blunder konyol—sesuatu yang gagal dilakukan oleh ChatGPT.
“AI generik seperti ChatGPT dibuat untuk berbicara dan menulis, bukan berpikir strategis mendalam di satu domain,” jelas Dr. Aditya Rahman, dosen AI Universitas Indonesia. “Ini contoh klasik bagaimana spesialisasi masih mengalahkan generalisasi.”
Pelajaran untuk Industri AI
Kekalahan ChatGPT bukan hanya bahan tertawaan di media sosial, tapi juga menjadi pengingat penting bagi pengembang teknologi. AI generatif seperti ChatGPT memang mampu merangkai teks yang tampak cerdas—membuat puisi, merangkum dokumen, atau berdiskusi—namun belum mampu menyaingi AI spesialis di tugas-tugas tertentu.
“Masalah mendasar LLM seperti ChatGPT adalah overconfidence,” kata Rahman. “Model ini bisa menjawab dengan sangat meyakinkan meski salah total. Itu berbahaya dalam konteks tertentu, misalnya penalaran matematis atau strategi permainan seperti catur.”
Pakar menilai tantangan berikutnya bagi pengembang AI adalah memadukan kemampuan bahasa alami dengan modul reasoning khusus. Misalnya, menggabungkan model bahasa dengan engine catur seperti Stockfish.
“Jangan salah paham, ChatGPT adalah kemajuan besar. Tapi ini pengingat bahwa AI belum pintar dalam artian manusia. Kita masih harus mengembangkan sistem yang tahu batas dirinya,” tegas Rahman.