Cloudflare 细化网络爬虫屏蔽管理,将默认禁止 AI 代理与训练爬虫访问广告页面

依依百科 百科资讯 1

7 月 2 日消息,互联网基础服务企业 Cloudflare 当地时间 1 日宣布细化网络爬虫屏蔽管理,根据其行为对爬虫机器人赋予搜索、代理(智能体)、训练等一系列标签,并计划在 2026 年 9 月 15 日默认禁止 AI 代理与训练爬虫访问含广告的网页。

Cloudflare 表示,大多数网站所有者都希望自己的内容既能够被人工智能发现又不会损失来自知识产权的收益。负责任的 AI 企业会清晰标记其网络爬虫机器人的用途,但仍然存在相当数量的混合型爬虫,同时具备多种功能。

Cloudflare 的爬虫管理器会为混合型爬虫匹配其所有行为模式,这意味着多任务爬虫只要一种行为被网页所有者禁止就无法在特定网站上爬取。

Cloudflare 还将为网站所有者提供新版归因业务洞察仪表板,适应搜索优化从 SEO 到 GEO 再到 AEO(注:答案引擎优化)的变迁。Cloudflare 还将推出页面变动监控以避免无意义的重复抓取,并提供按使用计价的抓取付费模式。