Cloudflare、AIスクレイピングを防ぐ無料ツールを提供

今回は「Cloudflare、AIスクレイピングを防ぐ無料ツールを提供」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 人工知能(AI)のトレーニングのためにAIボットがウェブサイトのコンテンツをスクレイピングするのが心配なら、Cloudflareがその対策に役立つ。

 ウェブの約20%でプロクシとして利用されていると主張するCloudflareは、すべてのAIボットがサイトのテキストをスクレイピングするのを防ぐ新しいツールを導入した。同社によると、無料でサービスを利用している顧客も含め、すべての顧客にこのツールを提供するという。

 生成AIの台頭により、企業はチャットボットをトレーニングするためのコンテンツを必要としている。多くの企業は、(「ChatGPT」が「Reddit」への投稿を利用してやっているように)分析用にサイトからテキストを抽出するウェブスクレイピングツールを利用している。ウェブスクレイピングボットについて隠し立てせず正直な企業もあれば、そうではない企業もある。

 Cloudflareは2023年9月、許可なしにサイトをスクレイピングする「悪質な」AIのウェブクローラーをユーザーがブロックできる機能をリリースした。当然ながら、一部の企業は、信用できるスクレイピングツールを装ったスクレイピングツールを用意して、ブロックを回避した。そのため、今回の新しいツールは、スクレイピングの適切なプロトコルに従うものも含め、すべてのAIクローラーをブロックする。

 2024年6月には、Cloudflareを利用している上位100万件の「インターネット資産」のうち約39%にAIボットがアクセスしていた、と同社は述べている。それらの資産のうち、AIボットをブロックする措置をとっていたのは3%未満だった。同社によると、サイトをスクレイピングしていた上位4つのボットは「Bytespider」「Amazonbot」「ClaudeBot」「GPTBot」だったという。

 「TikTok」の運営元である字節跳動(バイトダンス)が保有するBytespiderは、ChatGPTと競合する「Doubao」など、大規模言語モデル用のトレーニングデータを収集するのに利用されている。Amazonbotは「Alexa」の質問回答機能、ClaudeBotはチャットAIの「Claude」、GPTBotはChatGPTのトレーニングにそれぞれ利用されている。

 Cloudflareのユーザーであれば、このツールは簡単に利用できる。ダッシュボードの設定セクションに進んでから「Security」>「Bots」をクリックすると、「AI Scrapers and Crawlers」というトグルボタンが表示される。このトグルボタンをオンにすれば、AIボットはもうコンテンツにアクセスできなくなる。

 もちろん、AIボットは絶えず進化している。Cloudflareによると、この機能は有害なボットの「フィンガープリント」を検知するため、やはり自動的に進化するという。

 新ツールは米国時間7月5日からすべてのCloudflareユーザーを対象に提供されている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
primeNumber、データテクノロジー事業でインドに進出–現地でビジネス開発チームを発足
IT関連
2024-02-22 14:03
マイクロソフトがXbox向けChromiumベースEdgeブラウザーのオープンテストを開始
ゲーム / eSports
2021-03-09 08:46
GitHub、「Code scanning autofix」パブリックベータ版を提供–検知された脆弱性に対してコード提案
IT関連
2024-03-23 13:10
複数の事業体を運営する中堅企業向け財務管理ソフトウェアのAccountsIQが約7.4億円を調達
ソフトウェア
2021-02-22 16:42
WebAssemblyアプリ開発で最も使われている言語は3年連続で「Rust」、Webアプリ開発が最多、欲しい機能はスレッド。The State of WebAssembly 2023
JavaScript
2023-10-27 22:55
IIJ、ゼロトラストを実現する新リモートアクセスサービスを提供
IT関連
2022-01-27 23:04
アップルが104億円を投じる「人種の公平性と正義のためのイニシアチブ」関連の新たな取り組みを発表
パブリック / ダイバーシティ
2021-01-15 03:21
河野大臣、テレワークの虚偽報告に「処分の対象となり得る」と警告 霞が関の出勤抑制巡り
ネットトピック
2021-01-14 02:25
ヨドバシの中の人が初めて語る、ヨドバシ.comを支える内製プライベートクラウドの中身
クラウド
2022-11-04 19:27
「動物虐待+都道府県名」で通報先表示 Yahoo!検索に新機能
社会とIT
2021-06-02 22:03
「Microsoft Teams」の個人/法人向けアプリが統一へ
IT関連
2024-03-15 03:03
コロナワクチン接種証明アプリ、ニューヨーク州が提供開始 IBMによるブロックチェーンシステム採用
ブロックチェーン導入事例
2021-03-30 22:28
BIPROGY、金融ソリューション群を共通アーキテクチャーで統合へ
IT関連
2023-02-12 06:24
アテネのベンチャーキャピタル集まれ:TechCrunchヨーロッパVC大調査の結果レポートに載ろう
VC / エンジェル
2021-01-21 21:53