Cloudflare、AIスクレイピングを防ぐ無料ツールを提供

今回は「Cloudflare、AIスクレイピングを防ぐ無料ツールを提供」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 人工知能(AI)のトレーニングのためにAIボットがウェブサイトのコンテンツをスクレイピングするのが心配なら、Cloudflareがその対策に役立つ。

 ウェブの約20%でプロクシとして利用されていると主張するCloudflareは、すべてのAIボットがサイトのテキストをスクレイピングするのを防ぐ新しいツールを導入した。同社によると、無料でサービスを利用している顧客も含め、すべての顧客にこのツールを提供するという。

 生成AIの台頭により、企業はチャットボットをトレーニングするためのコンテンツを必要としている。多くの企業は、(「ChatGPT」が「Reddit」への投稿を利用してやっているように)分析用にサイトからテキストを抽出するウェブスクレイピングツールを利用している。ウェブスクレイピングボットについて隠し立てせず正直な企業もあれば、そうではない企業もある。

 Cloudflareは2023年9月、許可なしにサイトをスクレイピングする「悪質な」AIのウェブクローラーをユーザーがブロックできる機能をリリースした。当然ながら、一部の企業は、信用できるスクレイピングツールを装ったスクレイピングツールを用意して、ブロックを回避した。そのため、今回の新しいツールは、スクレイピングの適切なプロトコルに従うものも含め、すべてのAIクローラーをブロックする。

 2024年6月には、Cloudflareを利用している上位100万件の「インターネット資産」のうち約39%にAIボットがアクセスしていた、と同社は述べている。それらの資産のうち、AIボットをブロックする措置をとっていたのは3%未満だった。同社によると、サイトをスクレイピングしていた上位4つのボットは「Bytespider」「Amazonbot」「ClaudeBot」「GPTBot」だったという。

 「TikTok」の運営元である字節跳動(バイトダンス)が保有するBytespiderは、ChatGPTと競合する「Doubao」など、大規模言語モデル用のトレーニングデータを収集するのに利用されている。Amazonbotは「Alexa」の質問回答機能、ClaudeBotはチャットAIの「Claude」、GPTBotはChatGPTのトレーニングにそれぞれ利用されている。

 Cloudflareのユーザーであれば、このツールは簡単に利用できる。ダッシュボードの設定セクションに進んでから「Security」>「Bots」をクリックすると、「AI Scrapers and Crawlers」というトグルボタンが表示される。このトグルボタンをオンにすれば、AIボットはもうコンテンツにアクセスできなくなる。

 もちろん、AIボットは絶えず進化している。Cloudflareによると、この機能は有害なボットの「フィンガープリント」を検知するため、やはり自動的に進化するという。

 新ツールは米国時間7月5日からすべてのCloudflareユーザーを対象に提供されている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
BoxとSlack、パートナーシップ拡大–「Slack」で利用可能な「Box AI」機能を提供
IT関連
2024-08-03 15:33
利用者が増えているところに攻撃者も追随していく–Trellixが2023年の脅威予測
IT関連
2023-01-20 10:41
関西電力、公益事業者向けソリューションで新しい料金オプションなどを提供
IT関連
2023-07-28 05:48
埼玉県朝霞市、AI機能を搭載した学習教材を導入–小中学生の学習定着に
IT関連
2024-07-10 15:08
freee、「freee人事労務 雇用契約」提供–「freee人事労務」上で雇用契約書の作成を可能に
IT関連
2023-11-29 20:05
「アジャイルサムライ」の著者が語る、技術志向の企業が世界をどう見ているのか? そしてソフトウェアテスト自動化を進化させる方法について(前編)。JaSST'22 Tokyo基調講演
CI/CD
2022-04-11 11:54
三省製薬、日立らとデジタル活用の店舗出店–AIアバターが製品を提案
IT関連
2023-03-07 13:38
AIをDevSecOpsプラットフォームに“編み込む”–GitLabのCSOが語るビジネス戦略
IT関連
2024-02-17 17:14
「人財のための財務諸表」を目指し日本に本社機能を移転中、シンガポール発の人事分析ツール「パナリット」が3.3億円調達
HRテック
2021-07-30 20:17
マイクロソフトの緊急パッチに一部のプリンターで印刷できない不具合
IT関連
2021-07-12 09:19
東大図書館など1300施設が使う蔵書検索システムが36年ぶりに刷新 電子資料に対応
企業・業界動向
2021-06-18 16:08
TIS、エンタープライズiPaaSを活用してバックオフィス業務を支援
IT関連
2023-03-03 11:29
ServiceNow、「Now Platform Tokyo」をリリース–新しい業務の在り方を支える新機能
IT関連
2022-10-06 03:51
手持ちのモノを売り支払いに充てられる決済プラットフォームTwigが約40.3億円調達、「グリーン」を謳うがそのサステナビリティにはほころびが見える
IT関連
2022-02-08 02:35