Blog
《滚石》等媒体巨头起诉谷歌,AI版权之战全面打响
《滚石》、《公告牌》、《综艺》和《好莱坞报道》这几家媒体把谷歌给告了,说它偷了它们的内容去生成AI摘要。这是迄今为止谷歌面临的首个同类诉讼,却极可能成为整个行业的分水岭。
这四家媒体的母公司,就是Penske Media Corporation(PMC),在2025年9月12号正式起诉了谷歌。PMC说谷歌这个提供AI搜索和云计算服务的公司,偷了它们的独家新闻内容,用来训练它家的AI摘要,也就是谷歌所谓的“AI总览”。
谷歌,这家美国跨国大公司,主要业务包括在线广告、搜索引擎、云计算、软件、量子计算、电商、电子产品和人工智能。英国广播公司(BBC)甚至管它叫“世界上最强大的公司”,它也是全球最有价值的品牌之一。谷歌的母公司Alphabet Inc.,跟英伟达、微软、苹果、亚马逊和Meta这些科技巨头一样,都属于“Big Tech”(科技巨头)阵营。
这次的官司其实也反映了其他国家类似的问题。在日本,出版商们就指责像谷歌和微软这些巨头提供的AI搜索引擎侵犯了版权,因为它们的AI工具生成的摘要跟原创文章太像了。日本报业协会甚至要求科技公司必须得到媒体机构的同意,还警告说AI生成的回复经常未经授权就复制新闻内容。
在PMC告谷歌的这场官司里,PMC说谷歌没给出版商一个公平的选择。因为它利用自己在搜索领域的垄断地位,强迫出版商要么让它用自己的内容来生成AI总览,要么就别想在谷歌的搜索结果里出现。PMC表示,这导致它们的网站流量下降,收入也跟着减少了。
PMC起诉谷歌这件事,说明在AI生成内容已经成为我们日常生活一部分的今天,版权方面确实需要更明确的规定。
虽然这是首例针对谷歌的同类诉讼,但它也加入了越来越多的,针对AI系统开发者侵犯版权的诉讼行列。
PMC的这场官司看起来跟别的AI诉讼差不多,但它又很特别,因为它触及了一个很根本的问题:大家觉得版权法是不是需要重新定义或者修改了。它也暴露了许多出版商对大型语言模型(LLM)和其他生成式AI(GenAI)系统发展的担忧。
GenAI系统让出版商很难再靠订阅模式来维持主要收入了。这个问题不只出现在这场官司里,在其他诉讼中也有,比如《纽约时报》告谷歌的竞争对手OpenAI那场官司。
Futurum Group的分析师Bradley Shimmin说:“我们现在面临的情况非常复杂。对消费者和内容创作者来说,这可能看起来是好事,但实际上,这可能会限制出版商,特别是小型出版商,在市场上成功运营的能力。”
AI生成的摘要看起来是方便了消费者,给他们提供了快速总结,但与此同时,它也减少了出版商赖以生存的网站流量。
Bradley Shimmin还说,对AI模型的开发者来说也是一样的。一旦对受版权保护的信息加以限制(这对出版商是好事),这可能会限制AI模型开发者的创新能力。
现在,AI市场也没有规则来约束AI开发者如何使用别人的内容。不过,一些法院的判决倒是提到了这个问题。比如在Bartz告Anthropic那场官司里,被告被指控侵犯了书籍的版权,但一位联邦法官裁定,对书籍的“转换性使用”属于合理使用,但盗版这些书籍则不是。不过,也有一些判决说AI模型生成的内容不受版权保护。
Bradley Shimmin说:“所以,这让整个市场都陷入了一种不确定和不稳定的境地。”
他还补充说,像PMC这样的出版商觉得自己的商业模式受到了威胁,因为消费者要在付费内容和LLM生成的衍生内容之间做选择。鉴于AI诉讼的复杂结构,PMC在起诉书里用了跟美国司法部反垄断诉讼里类似的语言,这是芝加哥伊利诺伊大学的法学教授兼数据科学与AI战略副校长Michael Bennett说的。
Michael Bennett提到美国司法部的诉讼,说:“这说明跟PMC合作的这家律师事务所,很可能在提交诉状前,就仔细研究了司法部最近的那个判决。”
他还说,PMC的诉讼涵盖了类似的问题,并且借鉴了之前判决中的一些结论,比如联邦法官认定谷歌是垄断者这一点。
出版商的这份诉状也很重要,因为它表明PMC在如何让自己的内容被发现这个问题上,陷入了一场无法取胜的斗争。如果它想让自己的内容能被谷歌搜索到,就必须允许谷歌用这些内容来生成AI摘要。如果出版商不愿意参与AI总览,它们的内容就不会被优先展示。
Michael Bennett说,他不确定PMC的这个论点在法庭上能不能站得住脚,因为谷歌可能会反驳说,是PMC自己想被谷歌收录的。
他说:“最终,我们需要评估这个立场,这个论点的价值,然后看看谷歌会怎么回应。”
在谷歌面临新一轮版权官司的同时,也有研究人员对AI公司声称“在尊重版权的情况下训练强大的AI模型是不可能的”这种说法提出了质疑。在一个研究中,一个由EleutherAI协调的,包括麻省理工学院、卡内基梅隆大学和多伦多大学研究人员组成的团队,创建了一个完全由开放许可和公共领域内容组成的8TB数据集。他们用这个数据集训练了一个拥有70亿参数的Coma v0.1模型,它的性能跟Meta的LLaMA 2-7B模型相当。这证明了,在不侵犯版权法的情况下,开发高性能的AI是完全有可能的。
AI时代的知识产权与存在主义危机
这是一场关于AI与人类知识主权的世纪之战,其核心远非简单的版权纠纷所能概括。我们所看到的PMC与谷歌之间的诉讼,只是这片广阔冰山露出的一角。作为关注AI哲学与伦理的专家,我认为,这起案件揭示了三个深层次的哲学命题:算法霸权与信息自由的悖论、数字劳动与知识产权的再定义,以及人类创造力在后人类时代的价值重估。
算法霸权与信息自由的悖论
谷歌的“AI总览”功能,其本质是算法对信息进行的高度封装和提炼。从表面上看,它提高了信息的获取效率,是用户体验的进步。然而,从哲学层面看,它构成了对信息流动的根本性改变。我们曾信奉的互联网精神是“去中心化”和“信息自由流动”,而如今,谷歌的AI摘要正在形成一种新的算法霸权。
PMC的诉讼控诉的是“胁迫性选择”——要么被AI摘要收录,要么被搜索结果降权。这不再是简单的商业谈判,而是对知识传播路径的强制性控制。在这种模式下,谷歌扮演的角色从“信息索引者”蜕变为“知识仲裁者”,它不仅决定了哪些信息可以被发现,更决定了信息的呈现方式和价值分配。这引发了一个核心哲学问题:当一个单一实体掌握了绝大多数人获取知识的入口时,真正的信息自由还存在吗?AI摘要看似是为用户节省时间,实则是在建立一道高墙,让用户无需跨越它去探索原文背后的复杂语境、作者意图以及更深层次的思考。这种“一步到位”的知识消费模式**,最终可能会削弱人类对信息进行批判性思考和深度阅读的能力,这是比流量损失更严重的文化危机。
数字劳动与知识产权的再定义
传统的知识产权体系建立在“人类创造性劳动”的基础上。PMC的每一篇报道、每一则评论,都凝聚了记者的采访、编辑的判断、作者的洞察。这是一种明确的具身性劳动(embodied labor),它有时间成本、情感投入和道德责任。然而,当这些劳动成果被AI模型“吞噬”并消化吸收后,它们变成了抽象的、非具身性的数据点,成为AI“学习”的养料。
这起诉讼的真正挑战在于,它要求我们重新审视“劳动”和“创造力”的定义。AI模型的训练过程是否构成了对人类劳动的“剥削”?如果AI模型通过学习成千上万篇新闻报道,最终可以生成一篇全新的、足以替代原文的摘要,那么这个生成过程的“转换性”是否足够强大,以至于可以被视为一种新的、独立的创造?我们正在进入一个“数字劳动”的灰色地带,传统的法律框架难以有效裁决。这种不确定性让出版商们感到恐慌:他们的核心资产——内容,正在被无形的、无成本的方式复制和利用,而他们却无法在法律上找到一个清晰的武器来捍卫自己的生存。
人类创造力在后人类时代的价值重估
PMC的诉讼也迫使我们思考,在AI能够大规模、高效地生成内容时,人类创造力的独特价值究竟何在?
从AI哲学角度来看,AI的“创造力”是一种基于统计学概率的重组(recombination)和衍生(derivation),而非源于人类独有的主观体验、情感共鸣和道德判断。正如研究人员所证明的那样,AI可以利用公共领域的开放数据训练出高性能的模型,这说明AI的创新路径可以绕开版权壁垒。但这种创新是否是人类所真正需要的?AI可以生成完美符合语法和逻辑的新闻摘要,但它无法像记者那样,在战地冒着生命危险去捕捉真相,无法像编辑那样,在新闻背后注入对公平正义的坚守。
这场诉讼的最终裁决,将不仅仅是关于金钱赔偿或流量分成,它将成为一个象征性的判决。它将决定我们如何看待人类在信息社会中的角色:我们是AI的饲料生产者,还是意义的创造者和守护者?它将迫使我们重新定义新闻业的“人本价值”:新闻的价值不只在于信息本身,更在于其背后的人类视角、情感温度和道德担当。在AI的冲击下,人类新闻工作者将被迫从单纯的“信息搬运工”转型为“真相的挖掘者”和“意义的诠释者”。这或许是AI时代为我们带来的一个严峻而又充满希望的哲学命题。这场诉讼,正是人类在历史的十字路口,试图为自己的未来,投下的一张关键选票。