推广 热搜: 免费网赚论坛  中国网赚  在家上网赚钱  如何网赚  网赚qq群  网赚博客  福缘网赚  酷我网赚  外国网赚  网赚任务平台 

生成式AI战斗存在根本性缺陷

   日期:2024-04-24 14:43:05     来源:http://www.900614.com/    作者:小编    浏览:111    

上周,美国作家协会(Authors Guild)向世界上一些最大的生成型人工智能公司的领导人发出了一封公开信。该协议由9000多名作家签署,包括乔治·桑德斯(George Saunders)等著名作家,并要求“、、、”等网站“获得作者在训练人工智能时使用受版权保护材料的同意、认可和公平补偿”。创意人员声称自己的工作在训练生成式人工智能系统中发挥了作用,他们为获得认可和补偿而做出了一系列努力,上述请求只是其中最新的一次。

用于大型语言模型(llm)和其他生成式人工智能系统的训练数据一直是保密的。但这些系统使用得越多,作家和视觉艺术家的作品与这些系统的输出之间的距离就越大。许多人呼吁生成型人工智能公司公开其数据来源,并与作家协会一样,对那些使用了其作品的人进行补偿。其中一些请求是公开信和社交媒体帖子,但越来越多的请求是诉讼。

版权法在这方面起着重要作用。然而,它是一种工具,不足以解决艺术家们的全部焦虑,无论是长期以来对互联网颠覆世界的就业和薪酬的担忧,还是对隐私和个人(以及不受版权保护的)特征的新担忧。对于其中的许多问题,版权只能提供有限的答案。该科技博客的编辑迈克•马斯尼克(Mike Masnick)表示:“人工智能给社会的几乎每个方面都带来了许多问题。”“但我认为,把狭隘地关注版权作为解决问题的工具,真的是放错了地方。”

最近这些诉讼中最引人注目的是本月早些时候,喜剧演员莎拉·西尔弗曼(Sarah Silverman)和其他四位作家在两份单独的文件中起诉OpenAI,声称该公司未经许可就在他们的作品上训练了广受欢迎的ChatGPT系统。这两起集体诉讼都是由专门从事反垄断诉讼的Joseph Saveri律师事务所提起的。出于类似的原因,该公司还代理了Stability AI、Midjourney和DeviantArt等艺术家。上周,在该案的听证会上,美国地方法院法官威廉·奥里克(William Orrick)表示,由于这些系统是在“50亿张压缩图像”上训练的,涉案艺术家需要为他们的版权侵权索赔“提供更多事实”。

西尔弗曼案指控OpenAI可能通过“影子图书馆”窃取了这位喜剧演员的回忆录《尿床》(Bedwetter),这些图书馆里有大量的盗版电子书和学术论文。埃默里大学(Emory University)法学教授马修·萨格(Matthew Sag)表示,如果法院支持西尔弗曼和她的原告同伴,这一裁决可能会为法律如何看待用于训练人工智能模型的数据集树立新的先例。具体来说,它可以帮助确定当公司的模型刮掉受版权保护的材料时,公司是否可以声称合理使用。“我不会在这个问题上宣布结果,”萨格谈到西尔弗曼的诉讼时说。“但这似乎是所有已提交的案件中最令人信服的。”OpenAI没有回应置评请求。

萨格解释说,这些案件的核心是相同的一般理论:法学硕士“复制”了作者受保护的作品。然而,正如Sag在本月早些时候的听证会上所解释的那样,像GPT-3.5和GPT-4这样的模型并不是传统意义上的“复制”工作。Digest将是一个更合适的动词消化训练数据,以实现其功能:预测序列中最佳的下一个单词。萨格在参议院的证词中说:“与其把法学硕士看作是像修道院的抄写员一样抄写培训数据,不如把它看作是像学生一样从培训数据中学习更有意义。”

文章链接:http://900614.com/news/show-87631.html
 
 
更多>同类资讯

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  RSS订阅  |  违规举报