Posted in

OpenAI 正在「吞噬」媒体_AI阅读总结 — 包阅AI

包阅导读总结

1.

“`

OpenAI、媒体、合作、版权、影响

“`

2.

OpenAI 与多家媒体结盟,花钱买断内容以获取训练数据。这虽能提升 ChatGPT 性能,但对媒体利弊难料,可能导致流量与价值损失。媒体合作态度不一,其未来影响尚不确定。

3.

– 背景

– OpenAI 与 7 家媒体结盟,包括《大西洋月刊》、Vox Media 等。

– 合作目的

– OpenAI 为获取授权训练数据,提升 ChatGPT 性能并商业化。

– 媒体获得“位置”,ChatGPT 可能展示其文章。

– 面临问题

– 抓取数据曾遭抵制,OpenAI 改变策略付费合作。

– 媒体可能失去流量、付费用户和商业价值。

– 合作的不确定性及媒体行业商品化。

– 不同选择

– 多数媒体合作,也有独立出版商“逆势而为”。

– 对媒体行业和读者影响未知,ChatGPT 未来不确定。

思维导图:

文章地址:https://mp.weixin.qq.com/s/fKXwaEdyYZpOT32dJ1YoSQ

文章来源:mp.weixin.qq.com

作者:新智元

发布时间:2024/7/24 3:24

语言:中文

总字数:3736字

预计阅读时间:15分钟

评分:81分

标签:OpenAI,媒体合作,AI 模型训练,版权问题,互联网信息入口


以下为原文内容

本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com

【新智元导读】OpenAI已经与7家媒体结盟,花钱买断媒体生产的内容,将自己打造成为继谷歌和社交媒体之后新的「互联网主页」和信息入口。这对于媒体行业和读者意味着什么?OpenAI能成功吗?资深媒体人深入解读:这违背了媒体的利益,OpenAI也未必是赢家,决定权或许在读者手上。

5月30日,OpenAI宣布与两家领先的媒体出版商建立合作关系,它们分别是《大西洋月刊》(The Atlantic)和Vox Media。

《大西洋月刊》是一份有着167年历史的老牌出版商,凭借其观点专栏和高质量文章,在数字和网络时代依然屹立不倒。

Vox Media是一家新媒体初创公司,虽然历史不算悠久,但是作为后起之秀也成绩斐然。

这家公司由热门体育博客SB Nation发展而来,2011年推出了热门科技媒体The Verge,2014年推出了政治和综合新闻媒体Vox。

近年来Vox Media进行了大肆收购,连备受推崇且屡获殊荣的媒体也收入囊中,其中就包括《New York》杂志。

在不到一年的时间里,OpenAI已经与7家主要媒体结成联盟。

其中一些媒体还控股了许多有影响力、有品位的杂志,如德国出版商Axel Springer,就控股《政客》(Politico)、《Business Insider》和《图片报》(BILD)。

以下与OpenAI合作的7家主要媒体的完整名单以及合作起始时间。

很多交易的具体条款尚未披露,因为其中许多都是私营公司,不需要披露所有的财务交易。

但据说OpenAI支付了数千万美元,以便在出版商这里获得特权。

此外,来自科技媒体VentureBeat的爆料人称,VentureBeat也与OpenAI有过接触。

我应该指出的是,VentureBeat本身(虽然不是我个人)已经让我们的员工联系OpenAI讨论可能的合作伙伴关系,但我不知道这些谈判是如何进行的或讨论了什么,除了关于我们的部分发生在过去的一年里。

由此看来,后期会有越来越多的媒体和出版商与OpenAI建立合作。

显而易见的是,通过这样做,它可以获得授权的训练数据,用来建立强大的新人工智能模型,这些模型的写作能力将会不亚于《华尔街日报》的记者。

OpenAI的目的就是要提高ChatGPT的性能,并最终希望将这些工具商业化,再出售给这些媒体或者是该领域的其他媒体。

对于像Vox这样为YouTube制作视频内容、为Netflix制作授权纪录片和连续剧的数字媒体机构,OpenAI 可以将其作品用于训练生成式人工智能视频模型Sora。

为什么OpenAI甘愿付费?

OpenAI之前为了训练大模型,可是毫不客气地抓取了几乎互联网上全部的公共帖子。

此举招致了艺术家、创意人士,甚至是《纽约时报》等媒体公司的强烈抵制。

《纽约时报》曾因OpenAI抓取网站文章用于训练而起诉其侵犯版权

这使得OpenAI不再坚持「合法抓取公开数据,以实现变革」的立场,他们在数据伦理上受到了挑战。

因此,OpenAI去年推出了一段代码,网站所有者可以将其自己的网站添加到名单中,以阻止它对网站进行搜刮,用于训练。

OpenAI 最近还宣布将创建一款新产品——媒体管理器(Media Manager),艺术家、创作者和出版商可以用它来标记他们打算或已经在网上发布的作品,表示他们不希望看到这些作品被 AI 工具爬取并用于训练模型。

不过,这要到 2025 年才会实现,而且内容创建者并不一定会买账。

因此,对风头正盛的OpenAI 来说,付钱让出版商闭嘴并接受人工智能抓取和训练,不是一笔亏本的生意。

一来可以让自己摆脱困境,获得所需的数据,二来也向投资者和用户有了交代,显示自己对版权法和道德规范的遵守。

而内容所有者在这个过程中,并没有得到真正的回报。

出版商无一例外地都宣布了OpenAI内容许可协议,他们确实得到了一些东西,其中最重要的不是金钱,而是「位置」。

具体来说,几乎所有出版商都指出,ChatGPT 将在其输出中显示他们的文章。

因此,如果用户输入「总结最新科技新闻」,则可能会显示来自《Business Insider》、《The Verge》(Vox 旗下)、《华尔街日报》或其他任何包含在交易中的出版物的文章摘要,以及来源链接。

这仅仅是一种可能的设想,确切的协议或技术文档并没有被公开分享。

此外,目前还不清楚ChatGPT会如何使用来自媒体的内容,如果它采用「机器人式的」风格在原始文本的基础上进行概括,就可能会抹杀原作者本身创作的艺术性。

而且,由于用户在ChatGPT上已经阅读了经过概述的新闻,那他们就不会选择访问首发文章的网站,从而会使得这些出版物失去流量。这对于出版物来说,则意味着失去付费用户或者是商业价值。

这就是为什么The Information创始人Jessica Lessin、前Gawker记者Hamilton Nolan和前 Vice 记者Edward Onswego, Jr.等资深从业人士都指出,在与OpenAI的交易中,出版商承担了残酷后果。

毕竟,如果读者追求的是纯粹的信息,而ChatGPT提供给他们的就是纯粹的信息,那么他们访问首发媒体还有什么用,更不用说花钱订阅了。

用户会选择成为ChatGPT Plus,每个月向OpenAI交20美元,而不再光顾生产内容的媒体。

现在所发生的一切不禁让人想起谷歌新闻刚推出的时候,那是2006年,Facebook和Twitter等社交平台的用户数量和受欢迎程度开始增长,并迅速成为出版商的主要推荐流量来源。

在过去的15-20年里,基本维持着这样的情况。不过,由于这些平台背后的科技巨头的管理和不断调整算法,流量起起伏伏。

当某个科技平台突然改变算法,导致受众消失时,那些在某个平台或策略上投入过多精力的网站很快就会发现自己无所适从。

当然,变化还在不断发生,可以说最大的变化现在正摆在技术平台和出版商面前:生成式人工智能。

随着谷歌将自己错误的人工智能概述摘要结果放在搜索结果页面的顶部,并推低了指向出版商和新闻文章的直接链接,越来越多的人可能会选择采用 ChatGPT,作为新闻来源或聚合器。

新闻出版商和母公司的高管或许感到被逼到了墙角:游戏正在再次改变,人工智能正在到来,并取代了人们在网上获取新闻的传统方式。那么为什么不与颠覆者合作,尝试乘风破浪呢?

只不过,正如上文所述的简短历史课所显示的那样,科技公司总是随机地、不可预测地改变战略和工具,这让媒体公司懊恼不已。

虽然OpenAI现在正在与出版商友好相处,但从公开了解到的情况来看,没有迹象表明这种友好会一直持续下去,也无法肯定这能让出版商维持过去培养起来的收入和用户。

此外,OpenAI合作的出版商越多,每家出版商作为ChatGPT潜在信息源的价值就会被稀释,整个媒体行业也会变得更加商品化——它们通通都将成为 OpenAI模型和摘要的素材。

这些合作伙伴关系的乐观理由是「好吧,技术正在改变,媒体习惯正在改变,无论如何,我们不能再依赖谷歌或社交网站来吸引我们的观众」。

所以这可能是对于媒体出版商来说,最不坏的选择。

但是,既然有这么多公司自愿与OpenAI合作,那么权力的天平向谁倾斜也就不言而喻了。

虽然很多媒体争相和OpenAI合作,但也有另一部分人「逆势而为」,比如,404 Media、Platformer、Newcome等独立出版商的崛起。这些出版物主要建立在由新闻通讯平台Substack等提供的技术基础设施之上。

他们正在走的是一条不同的道路,试图利用由热门初创公司提供的底层技术,尽可能地与读者和订户直接建立关系。

然而,这些出版物的规模都很小,人手和资源都有限,无法像大型报纸和广播机构那样进行大型调查。

这种大型调查过去都是由大型报纸和广播机构进行的,他们曾获得过奖项,在某些情况下还改变了历史进程。

然而,随着广播和有线电视新闻收视率的下滑,以及越来越多的年轻人转向YouTube和TikTok等其他新闻来源,报纸本身的读者也在减少,受众是否对报纸和广播媒体曾经提供的调查感兴趣,还未可知。

这对媒体行业和读者意味着什么?

受众远离传统媒体及其深度调查,对民主、信息生态系统,乃至我们的人际关系和社会有什么影响?

也许我们不该过于悲观,说这会毁掉一切。

社交媒体让每一个人都有可能成为「公民记者」,它能够把这些「公民记者」和业余侦探等聚集在一起,努力挖掘重要信息(至少是有更多料的八卦)。

但随着访问传统媒体和与之互动的人数减少,整体的新闻消费率不断下降,互联网上会不会有更多的「数字暴民」?这对于人们了解世界和形成共同体没有好处。

那么,ChatGPT的未来如何呢?它是否会像Google那样成为许多人的新「互联网主页」?

答案并不是一定的。

因为Facebook也尝试过同样的事情,但它最终降低了新闻的优先级,转而支持「朋友和家人」共享的用户生成内容。

OpenAI有可能会和其他科技公司一样,发现其用户并没有真正来到ChatGPT寻找新闻。

https://venturebeat.com/ai/openai-is-devouring-the-media-industry/