Waspada! Data Pribadi Pengguna ChatGPT Rentan Dicuri Hacker, Ini Penyebabnya
ChatGPT diketahui memiliki celah keamanan yang muncul akibat cara chatbot dalam memproses perintah.
Tim peneliti dari Tenable telah mengidentifikasi sejumlah celah dalam sistem ChatGPT buatan OpenAI yang dapat dimanfaatkan oleh peretas untuk mengakses informasi pribadi dari riwayat obrolan dan memori pengguna.
Mereka menemukan tujuh masalah utama yang sebagian besar berasal dari cara kerja ChatGPT dan model pendukungnya, SearchGPT, saat melakukan pencarian di web sebagai respons terhadap permintaan pengguna, baik dalam mencari informasi, merangkum halaman, maupun mengakses URL.
Kerentanan ini memungkinkan penyerang untuk mengubah perilaku chatbot dengan berbagai cara tanpa sepengetahuan pengguna.
"Dengan menggabungkan dan mencocokkan semua kerentanan dan teknik yang kami temukan, kami mampu menciptakan bukti konsep untuk beberapa vektor serangan yang lengkap," kata Moshe Bernstein dan Liv Matan, peneliti keamanan siber dari Tenable, seperti yang dilansir oleh Dark Reading pada Senin (10/11).
Temuan dari Tenable ini menambah daftar panjang penelitian yang mengungkapkan kelemahan keamanan mendasar dalam Large Language Models (LLM) dan chatbot berbasis AI.
Sejak peluncuran publik ChatGPT pada akhir 2022, para peneliti telah berulang kali menunjukkan bagaimana teknik serangan seperti prompt injection, kebocoran data, dan jailbreaking dapat mengancam integritas sistem ini.
Serangan tersebut dilakukan dengan pendekatan yang sangat berbeda dibandingkan dengan kerentanan perangkat lunak tradisional, serta menunjukkan betapa sulitnya untuk mengurangi risiko yang ada.
Penelitian terbaru ini menjadi pengingat penting bagi perusahaan yang berencana mengintegrasikan LLM dan chatbot dalam operasional mereka, agar lebih berhati-hati dan mempertimbangkan potensi implikasi keamanan yang mungkin timbul.
7 Kerentanan di ChatGPT
Tenable mengungkapkan tujuh kerentanan yang terkait dengan cara ChatGPT menerima dan memproses instruksi dari berbagai sumber eksternal, seperti situs web yang dikunjungi, hasil pencarian, komentar di blog, serta URL yang dibuat khusus.
Menurut Tenable, perusahaan ini menjelaskan bagaimana seorang penyerang dapat memanfaatkan kelemahan-kelemahan tersebut dengan menyisipkan prompt berbahaya ke dalam komentar blog, 'meracuni' hasil pencarian untuk menghindari filter keamanan ChatGPT, serta menggunakan cara ChatGPT dalam menangani riwayat percakapan dan menyimpan memori.
1. Indirect Prompt Injection in Browsing Context Kerentanan ini muncul ketika seorang penyerang menyisipkan instruksi berbahaya ke dalam konten eksternal yang tampak sah, seperti komentar pada postingan blog atau halaman web yang terpercaya. Apabila pengguna meminta ChatGPT untuk merangkum isi halaman tersebut, komponen penjelajah web akan mengambil dan melaksanakan instruksi yang tersembunyi. Instruksi ini dapat mengubah respons ChatGPT, contohnya dengan mengarahkan pengguna ke situs phishing yang berbahaya, semua ini dilakukan tanpa sepengetahuan pengguna.
2. Safety Mechanism Bypass Mekanisme keamanan ChatGPT dirancang untuk memblokir URL yang dianggap tidak aman. Namun, penelitian menunjukkan bahwa penyerang dapat mengakali fitur ini. Mereka melakukannya dengan memanfaatkan URL wrapper yang terpercaya untuk menyamarkan tautan berbahaya. Karena ChatGPT mempercayai domain wrapper tersebut, tautan berbahaya tersebut dapat ditampilkan kepada pengguna dan dieksekusi, yang berpotensi mengarahkan pengguna ke situs web yang berbahaya.
3. Conversation Injection Kerentanan ini mengeksploitasi cara ChatGPT berinteraksi dengan SearchGPT. Seorang penyerang dapat menyisipkan instruksi berbahaya ke dalam konten yang diambil oleh SearchGPT. Setelah instruksi ini terintegrasi ke dalam topik percakapan, ChatGPT akan menanggapinya seolah-olah instruksi tersebut merupakan bagian dari diskusi sebelumnya. Hal ini memaksa model untuk memberikan balasan yang tidak sesuai dengan maksud awal.
4. Penyembunyian Konten Berbahaya Kerentanan ini mengeksploitasi kesalahan dalam pemformatan markdown yang ada di ChatGPT. Melalui metode ini, penyerang dapat menyembunyikan instruksi atau prompt berbahaya di dalam teks dengan menempatkannya dalam blok kode yang tidak terformat dengan benar. Meskipun tampak seperti pesan yang bersih atau tidak mencurigakan bagi pengguna, ChatGPT tetap dapat membaca dan mengeksekusi konten yang tersembunyi di balik blok kode tersebut. Teknik ini terbukti sangat efektif untuk menyuntikkan perintah secara diam-diam.
5. Injeksi Prompt Tidak Langsung Tanpa Klik dalam Konteks Pencarian Kerentanan ini sangat berbahaya karena tidak memerlukan interaksi dari pengguna selain mengajukan pertanyaan. Ketika pengguna mengajukan pertanyaan, komponen pencarian ChatGPT dapat mengambil halaman web yang telah diracuni oleh penyerang. Halaman tersebut mengandung instruksi berbahaya yang kemudian dieksekusi oleh model. Ini menunjukkan bahwa kompromi dapat terjadi hanya dengan mengajukan pertanyaan yang secara kebetulan memicu pencarian ke situs berbahaya.
6. Injeksi Memori Persisten Kerentanan ini menargetkan fitur memori ChatGPT yang menyimpan informasi penting mengenai pengguna. Setelah berhasil melakukan injeksi prompt dalam satu sesi, penyerang dapat memaksa ChatGPT untuk menyimpan instruksi berbahaya sebagai memori jangka panjang. Akibatnya, setiap kali pengguna memulai percakapan baru, instruksi berbahaya tersebut akan dipanggil kembali, yang dapat menyebabkan model terus-menerus membocorkan data pribadi atau melakukan tindakan berbahaya di sesi berikutnya hingga memori tersebut dihapus secara manual.
7. Eksfiltrasi Data Kerentanan ini merupakan hasil akhir dari kombinasi kerentanan sebelumnya. Tenable menunjukkan bagaimana penyerang dapat mengintegrasikan teknik-teknik seperti injeksi prompt dan bypass mekanisme keamanan untuk mencuri data sensitif, seperti riwayat obrolan pengguna atau informasi dari layanan lain yang terhubung, seperti Google Drive atau Gmail, dan mengirimkannya ke server yang dikuasai oleh penyerang. Ini adalah vektor serangan yang lengkap mulai dari penyuntikan instruksi hingga pencurian data yang berhasil.
Kerentanan Pengaruh ke GPT-5
Berenstein menyatakan bahwa sangat mungkin bagi penyerang yang memiliki sumber daya besar, seperti kelompok Advanced Persistent Threat (APT), untuk memanfaatkan satu atau lebih kerentanan demi melancarkan kampanye yang ditujukan kepada banyak pengguna.
Tenable melakukan sebagian besar penelitian mereka menggunakan ChatGPT-4o, tetapi mereka juga menemukan bahwa beberapa kerentanan dan bukti konsep, termasuk masalah indirect prompt injection serta kerentanan zero click dan one click, tetap berlaku pada ChatGPT-5.
Perusahaan tersebut melaporkan masalah ini kepada OpenAI pada bulan April, dan OpenAI telah mengonfirmasi penerimaan laporan kerentanan dari Tenable. Namun, tidak ada penjelasan mengenai apakah OpenAI telah melakukan perbaikan terkait kerentanan yang dilaporkan tersebut.