Reddit Tuntut Perplexity atas Pengambilan Data
Reddit Memperbesar Pertempuran Hukum Melawan Pemanenan Data AI
Raksasa media sosial Reddit telah mengajukan gugatan hak cipta yang signifikan terhadap startup kecerdasan buatan Perplexity, menuduh perusahaan dan beberapa entitas pengikis data secara ilegal memperoleh simpanan konten yang dibuat pengguna Reddit yang luas. Inti dari tuduhan tersebut berpusat pada dugaan pengabaian Perplexity terhadap perlindungan teknologi yang dirancang untuk melindungi data berhak cipta Reddit, yang dilaporkan digunakan oleh perusahaan AI tersebut untuk melatih model AI-nya dan memberi daya pada "mesin jawabannya." Tindakan hukum ini menyoroti ketegangan yang semakin meningkat antara pengembang AI yang ingin memanfaatkan data online untuk pelatihan model dan platform konten yang bertujuan untuk mengontrol bagaimana materi mereka diakses dan dimanfaatkan.
Reddit, sebuah platform diskusi online yang luas yang membanggakan hampir dua dekade data percakapan yang diorganisir di berbagai komunitas berbasis minat, menyatakan bahwa kontennya tidak boleh dieksploitasi secara komersial tanpa perjanjian yang jelas. Gugatan tersebut mengklaim bahwa Perplexity dan diduga terdakwa bersama-samanya menggunakan crawler web dan bot untuk menyalin konten secara otomatis dari hasil pencarian Reddit dan Google yang menampilkan data Reddit. Akuisisi yang diduga tidak sah ini mengabaikan saluran lisensi yang telah ditetapkan yang dikelola Reddit, saluran yang dirancang untuk melindungi hak-hak platform dan penggunanya melalui pagar pembatas kontrak.
Perangkap "Tanda Khusus"
Dalam uraian rinci tentang penyelidikan mereka, tim hukum Reddit menggambarkan pembuatan perangkap canggih untuk menangkap Perplexity saat beraksi. Perusahaan media sosial tersebut membuat postingan tes yang secara khusus dirancang untuk diindeks hanya oleh mesin pencari Google, platform yang dengannya Reddit memiliki perjanjian lisensi konten. Perplexity, bagaimanapun, tidak memiliki lisensi seperti itu. Gugatan tersebut menuduh bahwa satu-satunya cara Perplexity dapat mengakses konten tes spesifik ini adalah dengan mengabaikan langkah-langkah perlindungan Reddit melalui hasil pencarian Google. Dalam beberapa jam, AI Perplexity mulai memunculkan konten dari postingan tes ini, yang diklaim Reddit sebagai bukti definitif bahwa Perplexity, baik secara langsung atau melalui mitra pengikis datanya, telah mengumpulkan data dari hasil mesin pencari Google dan dengan cepat memasukkannya ke dalam sistemnya sendiri.
Tuduhan Pengabaian dan Pengayaan yang Tidak Sah
Gugatan tersebut, yang diajukan di Distrik Selatan New York, mencakup klaim pelanggaran Digital Millennium Copyright Act (DMCA) yang secara khusus menargetkan ketentuan anti-pengabaian, bersama dengan klaim pengayaan yang tidak sah dan persaingan yang tidak sehat. Strategi Reddit berfokus pada tindakan melewati kontrol teknologi daripada semata-mata pada penggunaan akhir materi berhak cipta. Keluhan merinci bagaimana terdakwa diduga menutupi identitas, merotasi alamat IP, dan mengabaikan kontrol akses untuk mengikis miliaran Halaman Hasil Mesin Pencari Google (SERP) yang berisi konten Reddit. Data ini kemudian diduga diserap oleh AI Perplexity. Reddit berpendapat bahwa akses tidak sah ini telah menyebabkan kerugian yang signifikan, termasuk hilangnya keuntungan, peluang bisnis, dan kerugian reputasi, sambil memperkaya Perplexity atas biaya Reddit.
Peran Perusahaan Pengikis Data
Inti dari gugatan Reddit adalah tuduhan terhadap tiga perusahaan pengikis data spesifik: Oxylabs UAB, AWM Proxy, dan SerpApi. Reddit menuduh bahwa Perplexity berkolaborasi dengan perusahaan-perusahaan ini untuk memfasilitasi pengabaian "skala industri" dari kontrol akses Reddit dan Google. Perusahaan-perusahaan ini dituduh berpotensi mengikis postingan Reddit tanpa izin dan kemudian menjual data ini kepada Perplexity. Gugatan tersebut menyatakan bahwa praktik Perplexity tidak hanya merusak perjanjian lisensi yang ada tetapi juga mengalihkan keterlibatan pengguna dari Reddit. Dengan mengurangi kebutuhan pengguna untuk mengunjungi Reddit secara langsung, praktik ini mengurangi utilitas komersial platform dan berpotensi membahayakan privasi pengguna dengan menangkap postingan yang dibatasi atau dihapus, menghalangi kemampuan Reddit untuk menghormati permintaan pengguna dan menjaga kepercayaan.
Pembelaan Perplexity dan Lanskap Data AI yang Lebih Luas
Menanggapi gugatan tersebut, Perplexity telah menyatakan secara publik bahwa ia "tidak melatih model AI pada konten." Pernyataan ini, yang dibuat di Reddit sendiri, menunjukkan strategi pembelaan yang mungkin berpusat pada bagaimana data tersebut pada akhirnya digunakan, daripada bagaimana data tersebut diperoleh. Namun, argumen hukum Reddit, terutama ketergantungannya pada klaim anti-pengabaian DMCA, menggeser fokus ke hulu ke tindakan melanggar hambatan teknis. Kasus ini melambangkan perdebatan yang lebih luas di industri AI mengenai batasan etis dan hukum pemanenan data untuk pelatihan AI. Seiring model AI menjadi lebih canggih, permintaan untuk kumpulan data yang luas semakin meningkat, menempatkan platform seperti Reddit pada posisi kritis untuk mempertahankan hak kekayaan intelektual dan data pengguna mereka terhadap apa yang mereka anggap sebagai pemanenan yang tidak sah dan berpotensi berbahaya.
Implikasi Masa Depan untuk Pengembangan AI dan Platform Konten
Hasil dari gugatan Reddit terhadap Perplexity dapat menetapkan preseden penting untuk cara perusahaan AI mengakses dan memanfaatkan data dari platform online. Jika Reddit menang, hal itu dapat mendorong pembuat konten dan platform lain untuk mengejar jalur hukum serupa, yang berpotensi menyebabkan kontrol yang lebih ketat pada pemanenan data dan negosiasi lisensi yang lebih kuat. Sebaliknya, keputusan yang menguntungkan Perplexity dapat mengklarifikasi praktik yang dapat diterima untuk akuisisi data pelatihan AI, atau menyoroti perlunya standar industri yang lebih jelas. Strategi hukum yang digunakan, terutama fokus pada tindakan anti-pengabaian di bawah DMCA, menawarkan pendekatan baru untuk sengketa kekayaan intelektual di era digital. Kasus ini menggarisbawahi tantangan yang sedang berlangsung dalam menyeimbangkan inovasi dalam AI dengan perlindungan materi berhak cipta dan privasi pengguna di dunia yang semakin berbasis data.