Reddit ฟ้อง Perplexity ฐานขโมยข้อมูล
Reddit ยกระดับการต่อสู้ทางกฎหมายกับ Perplexity ในข้อหาขโมยข้อมูล AI
ยักษ์ใหญ่โซเชียลมีเดีย Reddit ได้ยื่นฟ้องคดีละเมิดลิขสิทธิ์ครั้งสำคัญต่อ Perplexity สตาร์ทอัพปัญญาประดิษฐ์ โดยกล่าวหาว่าบริษัทและหน่วยงานขโมยข้อมูลหลายแห่งได้ขโมยเนื้อหาที่ผู้ใช้สร้างขึ้นจำนวนมหาศาลของ Reddit ไปอย่างผิดกฎหมาย ประเด็นหลักของการกล่าวหามุ่งเน้นไปที่การที่ Perplexity กล่าวหาว่าหลีกเลี่ยงมาตรการป้องกันทางเทคโนโลยีที่ออกแบบมาเพื่อปกป้องข้อมูลลิขสิทธิ์ของ Reddit ซึ่งบริษัท AI ดังกล่าวรายงานว่าใช้เพื่อฝึกฝนโมเดล AI และขับเคลื่อน "เครื่องมือตอบคำถาม" การดำเนินการทางกฎหมายนี้เน้นย้ำถึงความตึงเครียดที่เพิ่มขึ้นระหว่างผู้พัฒนา AI ที่ต้องการใช้ประโยชน์จากข้อมูลออนไลน์สำหรับการฝึกอบรมโมเดล และแพลตฟอร์มเนื้อหาที่ต้องการควบคุมวิธีการเข้าถึงและใช้งานวัสดุของตน
Reddit ซึ่งเป็นแพลตฟอร์มสนทนาออนไลน์ที่กว้างขวาง มีข้อมูลการสนทนาเกือบสองทศวรรษที่จัดระเบียบตามชุมชนตามความสนใจต่างๆ ยืนยันว่าเนื้อหาของตนต้องไม่ถูกแสวงหาผลกำไรเชิงพาณิชย์โดยไม่ได้รับข้อตกลงที่ชัดเจน การฟ้องร้องอ้างว่า Perplexity และผู้ร่วมจำเลยที่ถูกกล่าวหาได้ใช้เว็บครอว์เลอร์และบอทเพื่อคัดลอกเนื้อหาจากทั้ง Reddit และผลการค้นหาของ Google ที่แสดงข้อมูลของ Reddit โดยอัตโนมัติ การได้มาซึ่งการอนุญาตที่ไม่ได้รับอนุญาตนี้กล่าวหาว่าหลีกเลี่ยงช่องทางการออกใบอนุญาตที่มีอยู่ซึ่ง Reddit ดำเนินการ ช่องทางที่ออกแบบมาเพื่อปกป้องทั้งแพลตฟอร์มและสิทธิ์ของผู้ใช้ผ่านการควบคุมตามสัญญา
กับดัก "Marked Bill"
ในรายละเอียดของการสืบสวน ทีมกฎหมายของ Reddit ได้อธิบายถึงการตั้งกับดักที่ซับซ้อนเพื่อจับ Perplexity ในขณะกระทำผิด บริษัทโซเชียลมีเดียได้สร้างโพสต์ทดสอบที่ออกแบบมาเฉพาะเพื่อให้ Google ซึ่งเป็นแพลตฟอร์มที่ Reddit มีข้อตกลงอนุญาตให้ใช้เนื้อหาเท่านั้น เป็นผู้จัดทำดัชนี Perplexity นั้นไม่มีใบอนุญาตดังกล่าว การฟ้องร้องอ้างว่าวิธีเดียวที่ Perplexity จะเข้าถึงเนื้อหาทดสอบเฉพาะนี้ได้คือการหลีกเลี่ยงมาตรการป้องกันของ Reddit ผ่านผลการค้นหาของ Google ภายในไม่กี่ชั่วโมง AI ของ Perplexity ก็เริ่มแสดงเนื้อหาของโพสต์ทดสอบนี้ ซึ่ง Reddit โต้แย้งว่าเป็นหลักฐานที่ชัดเจนว่า Perplexity ไม่ว่าจะโดยตรงหรือผ่านพันธมิตรขโมยข้อมูลของตน ได้ขโมยข้อมูลจากผลการค้นหาของ Google และนำไปรวมไว้ในระบบของตนอย่างรวดเร็ว
ข้อกล่าวหาเรื่องการหลีกเลี่ยงและการได้รับประโยชน์โดยมิชอบ
การฟ้องร้องซึ่งยื่นฟ้องในเขต Southern District of New York รวมถึงข้อกล่าวหาเกี่ยวกับการละเมิด Digital Millennium Copyright Act (DMCA) โดยเฉพาะอย่างยิ่งที่มุ่งเป้าไปที่บทบัญญัติการต่อต้านการหลีกเลี่ยง ควบคู่ไปกับข้อกล่าวหาเรื่องการได้รับประโยชน์โดยมิชอบและการแข่งขันที่ไม่เป็นธรรม กลยุทธ์ของ Reddit มุ่งเน้นไปที่การกระทำของการหลีกเลี่ยงการควบคุมทางเทคโนโลยี แทนที่จะเป็นเพียงการใช้ประโยชน์จากวัสดุที่มีลิขสิทธิ์เป็นหลัก คำฟ้องมีรายละเอียดว่าจำเลยกล่าวหาว่าปกปิดตัวตน หมุนเวียนที่อยู่ IP และหลีกเลี่ยงการควบคุมการเข้าถึงเพื่อขโมยหน้าผลการค้นหาของ Google (SERPs) หลายพันล้านหน้าที่บรรจุเนื้อหาของ Reddit จากนั้นข้อมูลดังกล่าวก็ถูกนำเข้าโดย AI ของ Perplexity Reddit โต้แย้งว่าการเข้าถึงโดยไม่ได้รับอนุญาตนี้ก่อให้เกิดความเสียหายอย่างมีนัยสำคัญ รวมถึงการสูญเสียผลกำไร โอกาสทางธุรกิจ และความเสียหายต่อชื่อเสียง ในขณะที่ Perplexity ได้รับประโยชน์จากค่าใช้จ่ายของ Reddit
บทบาทของบริษัทขโมยข้อมูล
ศูนย์กลางของการฟ้องร้องของ Reddit คือข้อกล่าวหาต่อบริษัทขโมยข้อมูลสามแห่ง ได้แก่ Oxylabs UAB, AWM Proxy และ SerpApi Reddit โต้แย้งว่า Perplexity ร่วมมือกับบริษัทเหล่านี้เพื่ออำนวยความสะดวกในการหลีกเลี่ยงการควบคุมทั้งของ Reddit และ Google ใน "ระดับอุตสาหกรรม" บริษัทเหล่านี้ถูกกล่าวหาว่าอาจขโมยโพสต์ของ Reddit โดยไม่ได้รับอนุญาต จากนั้นจึงขายข้อมูลนี้ให้กับ Perplexity การฟ้องร้องเสนอว่าแนวปฏิบัติของ Perplexity ไม่เพียงแต่บ่อนทำลายข้อตกลงอนุญาตให้ใช้สิทธิ์ที่มีอยู่เท่านั้น แต่ยังเบี่ยงเบนการมีส่วนร่วมของผู้ใช้ออกจาก Reddit อีกด้วย ด้วยการลดความจำเป็นที่ผู้ใช้จะต้องเข้าชม Reddit โดยตรง แนวปฏิบัตินี้จึงลดคุณค่าทางการค้าของแพลตฟอร์ม และอาจส่งผลกระทบต่อความเป็นส่วนตัวของผู้ใช้ด้วยการจับโพสต์ที่ถูกจำกัดหรือลบออก ซึ่งขัดขวางความสามารถของ Reddit ในการปฏิบัติตามคำขอของผู้ใช้และรักษาความไว้วางใจ
การป้องกันของ Perplexity และภูมิทัศน์ข้อมูล AI ที่กว้างขึ้น
เพื่อตอบสนองต่อการฟ้องร้อง Perplexity ได้กล่าวต่อสาธารณะว่า "เราไม่ได้ฝึกอบรมโมเดล AI จากเนื้อหา" คำกล่าวนี้ซึ่งทำขึ้นบน Reddit เอง ชี้ให้เห็นถึงกลยุทธ์การป้องกันที่อาจมุ่งเน้นไปที่วิธีการใช้ข้อมูลในท้ายที่สุด แทนที่จะเป็นวิธีการที่ได้มา อย่างไรก็ตาม ข้อโต้แย้งทางกฎหมายของ Reddit โดยเฉพาะอย่างยิ่งการพึ่งพาข้อกล่าวหาการต่อต้านการหลีกเลี่ยง DMCA ได้ย้ายจุดสนใจไปที่ต้นน้ำ ซึ่งก็คือการกระทำของการละเมิดอุปสรรคทางเทคนิค กรณีนี้เป็นตัวอย่างของการถกเถียงที่กว้างขึ้นในอุตสาหกรรม AI เกี่ยวกับขอบเขตทางจริยธรรมและกฎหมายของการขโมยข้อมูลเพื่อการฝึกอบรม AI เมื่อโมเดล AI มีความซับซ้อนมากขึ้น ความต้องการชุดข้อมูลจำนวนมหาศาลก็เพิ่มสูงขึ้น ทำให้แพลตฟอร์มอย่าง Reddit อยู่ในตำแหน่งที่สำคัญในการปกป้องทรัพย์สินทางปัญญาและสิทธิ์ในข้อมูลผู้ใช้จากการที่พวกเขาเห็นว่าเป็นการขโมยโดยไม่ได้รับอนุญาตและอาจเป็นอันตราย
ผลกระทบในอนาคตต่อการพัฒนา AI และแพลตฟอร์มเนื้อหา
ผลลัพธ์ของการฟ้องร้อง Reddit ต่อ Perplexity อาจกำหนดหลักการสำคัญสำหรับวิธีการที่บริษัท AI เข้าถึงและใช้ประโยชน์จากข้อมูลจากแพลตฟอร์มออนไลน์ หาก Reddit ชนะ อาจเป็นการส่งเสริมให้ผู้สร้างสรรค์เนื้อหาและแพลตฟอร์มอื่นๆ ดำเนินการทางกฎหมายที่คล้ายคลึงกัน ซึ่งอาจนำไปสู่การควบคุมที่เข้มงวดขึ้นเกี่ยวกับการขโมยข้อมูลและการเจรจาใบอนุญาตที่แข็งแกร่งยิ่งขึ้น ในทางกลับกัน คำตัดสินที่เป็นคุณต่อ Perplexity อาจชี้แจงแนวปฏิบัติที่ยอมรับได้สำหรับการได้มาซึ่งข้อมูลการฝึกอบรม AI หรือเน้นย้ำถึงความจำเป็นสำหรับมาตรฐานอุตสาหกรรมที่ชัดเจนยิ่งขึ้น กลยุทธ์ทางกฎหมายที่ใช้ โดยเฉพาะอย่างยิ่งการมุ่งเน้นไปที่มาตรการต่อต้านการหลีกเลี่ยงภายใต้ DMCA นำเสนอแนวทางใหม่สำหรับข้อพิพาททรัพย์สินทางปัญญาในยุคดิจิทัล กรณีนี้เน้นย้ำถึงความท้าทายอย่างต่อเนื่องในการสร้างสมดุลระหว่างนวัตกรรมใน AI กับการปกป้องวัสดุที่มีลิขสิทธิ์และความเป็นส่วนตัวของผู้ใช้ในโลกที่ขับเคลื่อนด้วยข้อมูลมากขึ้น