AI爬虫无孔不入,Cloudflare要当网站的“救世主”

随着不久前美国法官支持Meta、Anthropic的诉求,做出了AI厂商使用受版权保护的作品来训练AI大模型属于合理使用这样的判决,AI业界真的是变天了。当法官认为硅谷AI大厂未经版权方许可的行为“符合版权激发创造力、促进科学进步的目的”,直接让拥有内容的版权所有者变得人人自危。

就在全世界的内容创作者和版权方都惴惴不安时,知名云服务提供商Cloudflare站了出来,日前该公司宣布将默认阻止AI爬虫在未经网站所有者许可或补偿的情况下抓取内容。据悉,每一个新注册Cloudflare的域名都将被询问是否允许AI爬虫访问,从而有效赋予网站阻止AI爬虫抓取其数据的能力。

Cloudflare的CEO马修·普林斯在相关声明中宣称,“我们的目标是将控制权交还给创作者,同时继续助力AI公司创新”。同时他还强调Cloudflare并未选择与AI厂商敌对,该公司还将提供AI厂商“按次付费爬取”以获取内容,并表示“这是通过建立多方共赢的新模式,守护自由繁荣互联网未来的关键举措。”

当AI厂商从法律层面获得了使用爬虫抓取内容的合理许可之后,全世界的内容创作者就已经失去用法律武器保护自己的可能,双方的对抗将回归技术攻防范畴。可是面对拥有强大技术实力的AI厂商,版权方保护内容的防线说是纸糊的都不为过。所以在这时候,Cloudflare的出现无异于是救内容创作者或版权方于水火之中。

当然,Cloudflare也不是做慈善的,其反AI爬虫功能仅提供给使用Cloudflare服务的创作者。作为全球知名的网络服务提供商,Cloudflare主要提供内容分发网络(CDN)、域名解析(DNS)、网络安全防护(如DDoS防御)等服务,反AI爬虫则是其用于吸引创作者、网站站长使用相关服务的“香饵”。

事实上,大量的内容创作者、网站站长、出版商等一切版权拥有者也几乎绝对会咬钩,因为他们正面临着一场“生存危机”。因为当下有越来越多的用户更喜欢通过与Gemini AI、ChatGPT、DeepSeek、文小言等AI聊天机器人对话的方式,来获取所需信息,并且不愿意点击聊天机器人提供的原始链接。

根据SEO方案解决商BrightEdge公布的数据显示,谷歌搜索的AI Mode今年6月在美国市场上线时,直接就导致传统URL链接的用户点击率下降了30%。要知道网站站长、出版商的商业模式是通过内容来吸引用户点击,再将用户访问产生的流量卖给广告商来赚钱。如果用户不访问,那么网站就无法获得维持运营所需的广告收入。

在版权方看来,他们与AI厂商之间已经不是“分赃不均”,而是AI厂商的出现导致他们不得不面临“生存危机”,并且有相当多的AI厂商并没有为AI爬虫获取的内容付费。有鉴于此,一切能阻碍AI厂商使用自己数据迭代AI大模型的手段,在版权方看来都是可以接受的。

那么Cloudflare有能力抵抗AI爬虫的进攻吗?据悉,Cloudflare的5秒盾(5-second challenge)可谓是反爬虫领域的一面旗帜,其会通过5秒等待时间配合多维度验证(如请求头、User-Agent、Cookies等)来区分真人用户与自动化工具,从而让无数爬虫在此折戟。

事实上,Cloudflare不仅在传统的反爬虫领域有口皆碑,在面对新兴的AI爬虫时同样也有建树。AI爬虫之所以会让相当多传统的反爬虫手段失效,盖因其实际上可以被视为是一种智能体,它们可以完全与真人一样操作浏览器,从而导致以往被用于分辨机器和人类的验证码、浏览器等常规反爬虫手段变得形同虚设。

对此Cloudflare拿出了被称为“AI废话迷宫”的AI Labyrinth,它属于通过诱导式陷阱来消耗爬虫的资源,而非直接拦截的“蜜罐技术”。具体来说,Cloudflare会在网页中嵌入含有仅对爬虫可见的隐藏链接,这些链接则指向由AI生成的虚假页面,虽然内容看似真实、但与被保护的网站无关。

简而言之,Cloudflare不仅不会拦截AI爬虫,而是选择引诱爬虫走进一个精心编织的多层嵌套虚假页面迷宫。AI爬虫一旦被引诱,就会在无意义的内容中团团转,从而浪费计算资源和带宽。其实Cloudflare的这番操作之所以会有效,核心机制就在于正常人不会对AI生成的无意义内容感兴趣。

如此一来,AI Labyrinth就实现了消耗AI厂商宝贵的算力和带宽,让后者觉得使用爬虫爬取你的网站缺乏性价比。不仅如此,Cloudflare方面还宣称陷入迷宫的AI爬虫行为会被记录,用于训练Cloudflare的识别模型,以形成“检测-诱捕-优化”的反馈闭环。

当然,Cloudflare也明白一味与AI厂商对抗,只会导致双方陷入无意义的消耗战。所以他们Cloudflare还提供了一个“按次付费爬取”的方案,允许网站所有者向AI厂商收取访问内容的相关费用,为AI行业合理获得内容提供了一条具备可行性的路径。

其实财大气粗的AI厂商不是不愿意为内容付费,例如谷歌就每年花费6000万美元获取Reddit的内容,OpenAI也宣布将付费使用德国出版巨头施普林格旗下出版物的内容。只是问题在于,互联网世界的内容提供商有如恒河沙数,AI厂商没有时间和人员逐个与不同的主体谈判,所以就只能抓大放小,针对小网站用技术手段、面对大网站则使用金钱攻势。

Cloudflare的这个方案,妙就妙在一边用技术手段将小网站武装成“刺猬”,另一边则提供了一个标准化的内容付费渠道。

*:not([class*=”icon”]):not([class*=”fa”]):not([class*=”logo”]):not([class*=”mi”]):not([class*=”code”]):not(i){font-family:PingFang SC,Arial,”Material Icons Extended”,stonefont,iknow-qb_share_icons,review-iconfont,mui-act-font,fontAwesome,tm-detail-font,office365icons,MWF-MDL2,global-iconfont,”Bowtie” !important;}[class*=”code”]{font-family: Consolas !important}

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/75117.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年7月4日 下午3:25
下一篇 2025年7月4日 下午3:26

相关推荐

  • 银行收硬币吗?武汉夫妻拉300公斤硬币跑5家银行被拒

    “300 公斤硬币装了 50 捆,小轿车轮胎都压爆了,跑 5 家银行没一家愿意收。” 武汉市民梁先生的遭遇曾引发热议 —— 他收到的 5 万元工程款全是 1 元硬币,却在银行碰了一鼻子灰。不少人都有过类似困惑:作为法定货币的硬币,银行到底收不收?记者走访全国多地网点并梳理监管政策发现,银行拒收硬币属违法行为,但实际兑换中确实存在诸多 “隐形门槛”,而一场破解…

    2025年10月17日
    15600
  • 四同窗“反目”暗战8个月,三雄极光交出亏损半年报

    编辑丨高远山 昔日并肩创业的大学同学,如今在董事会上针锋相对。LED照明龙头企业三雄极光(300625.SZ)正经历业绩下滑与管理层内斗的双重考验。 三雄极光于2025年8月22日公布的半年报显示,公司上半年营业总收入8.19亿元,同比下降16.49%;更严重的是,净利润从去年同期的盈利4195.33万元变成了亏损2366.42万元。这也是公司自2017年上…

    2025年8月24日
    11700
  • 车险理赔哪家好?2025车险公司前三强实测

    2025年11月,武汉一位奔驰车主的遭遇震惊全网:花67万买的电车被追尾报废,对方全责却只赔24万!更扎心的是,她今年刚按52万保额交了保费。这不是个例,上海市消保委调查显示,84.79%的新能源车主吐槽理赔流程比燃油车更繁琐。 买车险到底怎么选?今天结合2025年最新测评数据和真实案例,给你一份看完就能用的避坑指南。 2025车险公司前三强实测 先看黔东南…

    2025年11月7日
    12400
  • 荣耀重返前三?线下渠道暗藏胜负手

    低迷了近一年后,荣耀拿出了400系列想打破僵局。 荣耀的低迷肉眼可见,连续多个季度在国内出货量排名中跌出前五、沦为Others。就连CEO李健也坦言,“从去年下半年起,公司销量陷入困境”。 为什么荣耀会陷入困境?多位手机行业分析师对《号外工作室》表示,原因很多,但无法忽视的是,荣耀在线下失利,并且华为红利也在消失。 2020年底刚从华为独立时,荣耀不仅抢占了…

    2025年7月4日
    20200
  • 艾尼提便携式显微镜获权威媒体聚焦 科技赋能文保事业

    近日,由3R公司推出的“艾尼提便携式显微镜”在文保修复领域引发广泛关注。这款集高精度成像与便携性于一体的创新设备,已成功应用于敦煌研究院、故宫文保科技部等多家顶尖机构的文物修复工作,并获得《光明日报》、央视科教频道等权威媒体的专题报道,彰显科技赋能文物保护的重要价值。 艾尼提便携式显微镜助力古籍修复保护 精准诊断:微观检测破解修复难题 在敦煌莫高窟壁画修复现…

    2025年7月5日
    13800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信