Cloudflare、AIスクレイピングを防ぐ無料ツールを提供

今回は「Cloudflare、AIスクレイピングを防ぐ無料ツールを提供」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 人工知能(AI)のトレーニングのためにAIボットがウェブサイトのコンテンツをスクレイピングするのが心配なら、Cloudflareがその対策に役立つ。

 ウェブの約20%でプロクシとして利用されていると主張するCloudflareは、すべてのAIボットがサイトのテキストをスクレイピングするのを防ぐ新しいツールを導入した。同社によると、無料でサービスを利用している顧客も含め、すべての顧客にこのツールを提供するという。

 生成AIの台頭により、企業はチャットボットをトレーニングするためのコンテンツを必要としている。多くの企業は、(「ChatGPT」が「Reddit」への投稿を利用してやっているように)分析用にサイトからテキストを抽出するウェブスクレイピングツールを利用している。ウェブスクレイピングボットについて隠し立てせず正直な企業もあれば、そうではない企業もある。

 Cloudflareは2023年9月、許可なしにサイトをスクレイピングする「悪質な」AIのウェブクローラーをユーザーがブロックできる機能をリリースした。当然ながら、一部の企業は、信用できるスクレイピングツールを装ったスクレイピングツールを用意して、ブロックを回避した。そのため、今回の新しいツールは、スクレイピングの適切なプロトコルに従うものも含め、すべてのAIクローラーをブロックする。

 2024年6月には、Cloudflareを利用している上位100万件の「インターネット資産」のうち約39%にAIボットがアクセスしていた、と同社は述べている。それらの資産のうち、AIボットをブロックする措置をとっていたのは3%未満だった。同社によると、サイトをスクレイピングしていた上位4つのボットは「Bytespider」「Amazonbot」「ClaudeBot」「GPTBot」だったという。

 「TikTok」の運営元である字節跳動(バイトダンス)が保有するBytespiderは、ChatGPTと競合する「Doubao」など、大規模言語モデル用のトレーニングデータを収集するのに利用されている。Amazonbotは「Alexa」の質問回答機能、ClaudeBotはチャットAIの「Claude」、GPTBotはChatGPTのトレーニングにそれぞれ利用されている。

 Cloudflareのユーザーであれば、このツールは簡単に利用できる。ダッシュボードの設定セクションに進んでから「Security」>「Bots」をクリックすると、「AI Scrapers and Crawlers」というトグルボタンが表示される。このトグルボタンをオンにすれば、AIボットはもうコンテンツにアクセスできなくなる。

 もちろん、AIボットは絶えず進化している。Cloudflareによると、この機能は有害なボットの「フィンガープリント」を検知するため、やはり自動的に進化するという。

 新ツールは米国時間7月5日からすべてのCloudflareユーザーを対象に提供されている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
クラウドアイデンティティ管理のOktaが同業のスタートアップAuth0を約7000億円で買収
ソフトウェア
2021-03-06 13:48
HashiCorp、「Terraform Cloud」のプロジェクトにカスタマイズ機能
IT関連
2023-08-11 11:17
コロナ禍でパパ活蔓延 SNSで飛び交う隠語……企業公式アカウントで“誤爆”も
IT関連
2021-04-03 07:14
UiPath、AI関連機能の日本語対応やLLMを発表
IT関連
2024-06-21 10:38
DX推進の初動体制を整える–DXの環境整備の最初の一歩
IT関連
2022-09-15 02:10
CISO意識調査に見る日本と世界のギャップ
IT関連
2021-06-18 02:59
企業幹部も感じる“仕事と生活の衝突”–約7割が転職を検討
IT関連
2022-07-01 13:29
Coinbase、第4四半期決算で予想を上回るも年明けの低迷を受け株価は沈む
IT関連
2022-02-27 20:44
「iPhone」や「Android」端末を紛失してしまったら–GPSで追跡して発見するには
IT関連
2023-01-08 15:00
NEC、我孫子事業場から本社ビルに再生可能エネルギーを自己託送
IT関連
2024-02-08 13:10
168年の歴史を持つリーバイスのAI、データ活用、デジタル変革–責任者に聞く
IT関連
2021-04-20 02:27
深刻化する宇宙ゴミ–人工衛星の増加で急務となる対策の整備
IT関連
2023-01-06 17:43
「動物のお医者さん」など電子版コミックが半額に 白泉社「愛蔵版フェア」
くらテク
2021-08-13 08:11
ネットフリックスのTV向けアプリで「視聴中コンテンツ」削除機能が利用可能に
IT関連
2022-02-03 09:07