Reddit 槓 AI 廠:資料盜用爭端再起,怒告 Perplexity!

這篇報導的核心在於 Reddit 控告 AI 公司 Perplexity 非法抓取其用戶發布的內容,用於訓練其 AI 模型。這並非個案,而是內容創作者與 AI 產業之間數據權益衝突的最新一例。Reddit 指控 Perplexity 透過 Oxylabs、AWMProxy 和 SerpApi 等第三方,隱藏身份、偽裝網路爬蟲來非法獲取其受版權保護的內容。

Perplexity 則否認指控,並反控 Reddit 敲詐勒索,反對開放網路。他們聲稱自己只是總結和引用 Reddit 的公開討論,而非用於訓練模型,因此無需簽訂授權協議。Perplexity 更進一步指出,Reddit 此舉實際上是為了在與 Google 和 OpenAI 的數據授權談判中,展現其強硬姿態。

這起訴訟凸顯了 AI 模型訓練數據來源的爭議。Reddit 擁有龐大且活躍的用戶社群,其內容對於提升 AI 對話機器人的自然語言能力至關重要。Reddit 已經開始嘗試將其數據資源轉化為商業利益,與 OpenAI 和 Google 簽訂了授權協議,而 AI 授權收入已佔其總收入的近 10%。

我認為,這起訴訟反映了 AI 產業快速發展所帶來的法律和道德挑戰。一方面,AI 公司需要大量數據來訓練模型,而網路上的公開數據成為其重要來源。另一方面,內容創作者有權保護其知識產權,並從其內容的商業利用中獲益。如何平衡這兩者,將是未來一段時間內法律界和 AI 產業共同面對的難題。Reddit 的強硬態度,也可能引發更多類似的訴訟,進而影響 AI 產業的發展方向。

原文網頁:Reddit sues Perplexity for scraping of posts, expanding user data battle with AI industry (by Dylan Butts)

Comments

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *