再让AI大厂这么“偷”下去咱就看不到免费的网站了

2023-07-12 05:40:01

几天前，谷歌突然更新了隐私政策，明确表示要用网上所有的公开数据，来训练自家的 AI 模型。

(资料图)

也就是说，根据新政策，你在网上公开发布的任何信息都有可能被谷歌抓取，包括但不限于你发的帖子、搜索的关键词以及看过的视频。

这不妥妥互联网裸奔吗！

OpenAI 前脚刚被起诉数据侵权还没多久，谷歌就马上着急来撞枪口。

在这个节骨眼上整这么一出，大概率跟数据收费脱不了关系，谷歌再不薅这波免费的羊毛，之后很有可能就薅不到咯。

这事儿啊，自打 ChatGPT 爆火后再也没消停过。

世超先给大家伙儿捋捋时间线。

今年 3 月的时候呢，马斯克带头打响了数据收费第一枪，宣称推特的 API 接口不再免费了。

紧接着，美版贴吧Reddit 也按耐不住了。

上个月 Reddit 闹得沸沸扬扬的“停电”运动，就是为了抗议官方的 API 收费政策。

之前世超写这事儿的时候还在猜测， Reddit 官方最后会不会作出让步。

从现在的后续看来，大多第三方软件已经确认关停， Reddit 是铁了心要数据收费。

再到这段时间，推特又整了限流的幺蛾子，没有花钱认证的帐号每天就只能阅读 600条贴文，目的呢也是为了防止机器人抓取用户数据。

难道数据就这么值钱吗？

世超觉着啊，还是AI的锅。

AI 大模型要想变得更聪明，就需要源源不断的数据去“喂养”。

现在能做大模型的，要不就是自己家有数据，像百度、阿里和腾讯；要不就是爬人家的数据，这里点名 OpenAI 。

因为很多网站都开放有免费的 API 接口，才给了微软、 OpenAI 这些巨头可乘之机。

但今时不同往日， AI 在重新赋予数据价值以后，有筹码在手上的平台当然不乐意被白嫖了。

甚至于 Reddit 的 CEO 霍夫曼都把话搬上明面儿了：就是不想免费提供数据给巨头们。

所以， OpenAI 被起诉估计也是平台们联合起来想要“杀鸡儆猴”，治一治 AI 的这股歪风邪气。

不过，法律这次会不会站在 OpenAI 这边，还真不好说。

因为数据版权涉及到 3 个关键的问题：

1.数据爬虫的行为本身是否是合法的？

2.数据是否受到版权的保护？

3.用数据生成的作品是否受到版权保护？

首先第一个问题，要获取数据，无非就是付费购买，或者收集网上公开的数据。

但需要注意的是，公开的数据并不能等同于授权使用，而且还要看网站是不是有相关的条款对数据爬虫行为做出了限制。

要是直接越过版权方的同意，或者绕过了网站限制强行获取数据，那就是妥妥的非法获取计算机信息系统数据罪。

即使 OpenAI 声称爬的是公开网站的数据，数据爬虫行为本身是否合法，还要看版权方是不是给了授权。

其次，关于数据本身是否受到版权保护。

根据美国的版权法，如果 AI 模型训练所用的数据符合“合理使用”的范围，那就不会构成侵权。

但问题就出在这“合理使用”上。

“合理使用”的构成要件包括是否涉及商用、作品本身是否受版权法保护、所使用部分的数量以及使用之后对作品本身造成的影响这四个标准。

像什么新闻报道、学术研究，适当引用是完全 ok 的。

可 AI 模型上亿万级别的数据使用量、已经商业化的 AI 软件，还能算作“合理使用”吗？

最后，就是AI生成作品的版权问题。

因为训练数据版权理不清， AI 生成的内容自然也会存在版权争议。前几天， Steam 还下架了一款使用了 AIGC 生成的游戏，理由就是版权有问题。

咱就拿 AI 绘画举例子，图像生成相当于一个拆分又重组的过程，虽然最后的结果是完全“新”的，但仍然会保留训练图像的某些特征。

但这种情况到底算不算侵权，各国的说法现在也是众说纷纭。

因为训练数据是人家的，美国版权局认定 AI 生成的作品不受版权法保护，甚至还可能侵犯著作权。

而日本政府的态度则截然不同，表示日本法律不保护 AI 训练所用数据的版权。

至少在现行的法律框架下，上面这些问题很难得到一个统一的答案。

既然监管不给力，那版权方就只有提刀自己干了，该收费的收费，该追偿的也赶紧追偿。

▼OpenAI被起诉的文件

可以预见，在推特和 Reddit 之后，可能还会有更多的内容版权方竖起高墙。

这事儿呢，对于平台来说，当然是个挣钱的新路子，科技巨头再不济也就是多砸点儿钱。

但对于整个互联网来说，可算不上一件好事儿。

当年，互联网就是带着开放共享的基因出生的，像什么维基百科、推特，之前常年免费提供 API 接口，开发者调用数据很方便。

但现在如果让数据收费这么一搞，结果会怎么样还真不好说。

毕竟，小开发者没有支付巨额数据费的能力，如果创新只在巨头里发生，这不就是纯纯搞垄断了？

最主要的是，可能很多现在免费能看到的网站之后就要花钱才能看了，这才是对咱们这种普通用户的真实暴击。

其实吧，数据收费这事儿也不能全怪平台，实在是让 AI 巨头给“抢”怕了，算是一种自保的无奈之举。

虽然这次谷歌有“隐私政策”护体，但结果如何还真不好说。

所以，关键还要是看监管的大锤什么时候能落下。

厘清数据版权，是 AI 要发展始终绕不过去的一道坎儿，而现在，似乎也同样关乎着互联网的未来走向。

不知道 AI 这艘船，会将我们推向一个更开放，还是更封闭的时代？

关闭

相关推荐

再让AI大厂这么“偷”下去咱就看不到免费的网站了

解读中国汽车上半年：销量在增长，格局已生变

「新华视点」黑色产业链

中工漫评丨多措并举助万千民企敢闯能拼

关键词：

精彩组图

最新速递

天合光能：拟在四川什邡建设年产13GW单晶拉棒及配套项目生产基地

盛世中华何以中国｜于志勇：五星出东方

嘉泓物流(02130)：Roussel Christophe Albert Jean获任独立非执行董事

杭州贝赛思国际学校校长(杭州贝赛思国际学校官网校历)

海星股份最新公告：上半年净利同比预降69%-72%

李金发会见南苏丹矿业部部长一行

大洋电机(002249.SZ)：拟推“头部狼计划三期”员工持股计划筹资总额不超1860万元

天源环保(301127.SZ)：拟受让海域新能源部分股权并增资将获其65%股权

掌控老人的社保金退休金却拒不履行监护责任，检察院出手了！

上海中通大厦燃气泄漏有回应了：全面检查隐患，对问题管道应急整改！

PC行业惨淡，迷你电脑将会成为最后的救命稻草？我已经感受到了

南宁百货: 南宁百货大楼股份有限公司关于股东股权结构拟发生变更的提示性公告

用什么肥皂能彻底去除铅尘？

湖人第14人锁定空间五号位：伍德/大莫/格林3选1？浓眉减重回PF

离谱！“中字号”称遭“冒名”却难自证，蓝田总公司“陪绑”冤不冤？

证监会同意两家企业科创板IPO注册

6月信贷、社融双双好于市场预期住户贷款回暖明显

践行绿色低碳“睡眠升级”行动，喜临门倡导深度好睡眠

今天国际：预计2023年上半年净利润为1.9亿元~2.1亿元，同比增长78.2%~96.96%

网传67岁费玉清病危昏迷？姐姐、好友回应

72岁王石和女网红一起健身吃饭, 对方称其“爷爷”, 双腿暴露年龄

年金险买什么好？年金险怎样挑选？

物业公司由哪些部门监管（物业公司有哪些部门）

微软确认将继续裁员

国内首个多主架构方案发布：数据库产业生态的一次开放式升维

欧莱新材7月18日上交所首发上会拟募资5.77亿元

【视频】接连发生事故，都是因为这一点！交警发出重要警示

《文字玩出花》怎么通过改车发烧友关卡

人间丨71岁山东老太自驾游川藏，女儿回应：母亲是普通农民，50多岁考驾照，想看看祖国河山

保康县尧治河村小学第二届暑期义务爱心托管班开班

“棋”聚一堂！2023年全国象棋大师公开赛在山东新泰圆满结束

确定了！吉利和雷诺的动力总成公司预计年内成立

格尔格斯全名（格尔格斯）

骗子：退款1010元！杭州女子惊了：这一招真的行！

厦门现有新能源车11.4万辆明后两年购车免征车购税

美国通胀数据公布在即黄金白银震荡小涨

邹平市“让企业和企业家健康”主题活动启动

宣讲声声进企业党的理论入人心

最小说第七辑（关于最小说第七辑介绍）

2023年广东高考录取结果怎么查询？

华峰化学：上半年净利润同比预降42%-48%

Fisker第二季度产量低于目标

LG新能源与智利SQM公司签订锂购买协议

将向中国车企购买电动车平台授权？奥迪称将携手各方共同制定战略方针

新余市仙女湖区观巢镇：纵深推进创卫工作

办公室超标但不足一平米的如何处理（不足一平米卫生间如何装修）

天和磁材与高校或存合作研发隐而不宣两次申报“催生”数据矛盾

人民银行：6月末M2余额同比增长11.3% 上半年人民币贷款增加15.73万亿元

草字头十画的字有哪些十画的字有哪些

软妹头像软妹

夏日经济催生“捞金季”

台娱地震：小s被许雅钧赶出家门，具俊晔与小S双双回韩国？天了噜

1分钟汽笛响彻浦江这场航海盛宴你打卡了吗？

夏日经济催生“捞金季”

日本突然声称核污水危害健康，之前声称水可以喝，态度突然转变

没钱不发工资起诉找律师收费标准是多少

6月基金公司微博影响力：中欧富国鹏华保持前三博时、易方达排名下降

山东威海高新区：举办汽修行业技能比武

伤风败俗的意思（伤风败俗）

AppleVisionPro需要很长时间才能成为苹果业务的重要组成部分

租房交的“押金”到底能不能退？厘清性质很关键！

上海今年二批集中供地首日揽金逾193亿元

樊振东，重回世界第一！

小鲜追剧 |《繁华似锦》：「甜笑中偶」轻盈落地

马拉松知识科普 | 马拉松的历史起源

6月通胀数据点评：通胀持续磨底

南向资金今日净卖出20.79亿港元中国海洋石油逆势获净买入3.07亿港元

侃股：基金经理趋同交易图什么

北上资金今日净买入比亚迪4.35亿元、宁德时代3.29亿元

德祥地产(00199.HK)7月11日斥资50.05万港元回购60万股

广西壮族自治区防城区发布雷电黄色预警

紧盯江河湖库力保安全度汛

媒体融合再出发丨徐丹：线上线下相互融合，传播更具吸引力

360借条怎么提前还款 ?警惕！360借条提前还款付全息用户吐槽

广西大化瑶乡布努瑶欢度“祝著节”

双色球23079期晒票，应感谢每位让你蜕变的人，无论方式的好坏

夏日的紫薇花美出了天际，怀化人千万别错过

爆点大揭秘！短视频脚本创作必备技巧！

富士康宣布退出

半年121万辆，长安今年基本稳了

李溪芮《曾少年》开播出演北京大妞好评如潮

“江水空调”送冷暖 “微电网”供新能源——南京江北新区低碳节能二三事_江苏频道

?东方电热：上半年净利同比预增13.06%-40.5%

车市上半年：产销增长近一成，出口持续“狂飙”

1合11971年普利茅斯Cuda梅花疯狂不需要426HEMI就能脱颖而出

博德之门3火石手套获得方法

《武侠乂手游》日服登录不了怎么办

生意社：预计短期民用气市场低位整理运行

中关村上半年净利润预增563%-696%

大连热电5涨停

正式启动！汕尾投控携手用友驶向财务数智发展“快车道”

中国奥园：债权人小组成员已正式签立重组支持协议

*ST天山：股权转让纠纷案将于8月8日开庭

福建沙县：共织特色农网点染乡村振兴新画卷

钟情于热火！Shams：快船绿军询问利拉德加盟意愿，被响亮拒绝

*ST天山(300313.SZ)收到新疆高院传票

快收藏！乒超联赛名单出炉，13位世界冠军参加，许昕、刘诗雯回归

1500家品牌商携最新产品参会，青岛国际机床展7月18日开幕

三伏天减肥好时期，燕教授分享方法和建议

关于创商网 | 联系我们 | 投稿邮箱：920 891 263@qq.com 商务合作QQ：920 891 263

Copyright © 2008 - 2020 www.viltd.com. All Rights Reserved 中网

创商网版权所有

京ICP备2022016840号-26

1 360