Cloudflare、AIスクレイピングを防ぐ無料ツールを提供

今回は「Cloudflare、AIスクレイピングを防ぐ無料ツールを提供」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 人工知能(AI)のトレーニングのためにAIボットがウェブサイトのコンテンツをスクレイピングするのが心配なら、Cloudflareがその対策に役立つ。

 ウェブの約20%でプロクシとして利用されていると主張するCloudflareは、すべてのAIボットがサイトのテキストをスクレイピングするのを防ぐ新しいツールを導入した。同社によると、無料でサービスを利用している顧客も含め、すべての顧客にこのツールを提供するという。

 生成AIの台頭により、企業はチャットボットをトレーニングするためのコンテンツを必要としている。多くの企業は、(「ChatGPT」が「Reddit」への投稿を利用してやっているように)分析用にサイトからテキストを抽出するウェブスクレイピングツールを利用している。ウェブスクレイピングボットについて隠し立てせず正直な企業もあれば、そうではない企業もある。

 Cloudflareは2023年9月、許可なしにサイトをスクレイピングする「悪質な」AIのウェブクローラーをユーザーがブロックできる機能をリリースした。当然ながら、一部の企業は、信用できるスクレイピングツールを装ったスクレイピングツールを用意して、ブロックを回避した。そのため、今回の新しいツールは、スクレイピングの適切なプロトコルに従うものも含め、すべてのAIクローラーをブロックする。

 2024年6月には、Cloudflareを利用している上位100万件の「インターネット資産」のうち約39%にAIボットがアクセスしていた、と同社は述べている。それらの資産のうち、AIボットをブロックする措置をとっていたのは3%未満だった。同社によると、サイトをスクレイピングしていた上位4つのボットは「Bytespider」「Amazonbot」「ClaudeBot」「GPTBot」だったという。

 「TikTok」の運営元である字節跳動(バイトダンス)が保有するBytespiderは、ChatGPTと競合する「Doubao」など、大規模言語モデル用のトレーニングデータを収集するのに利用されている。Amazonbotは「Alexa」の質問回答機能、ClaudeBotはチャットAIの「Claude」、GPTBotはChatGPTのトレーニングにそれぞれ利用されている。

 Cloudflareのユーザーであれば、このツールは簡単に利用できる。ダッシュボードの設定セクションに進んでから「Security」>「Bots」をクリックすると、「AI Scrapers and Crawlers」というトグルボタンが表示される。このトグルボタンをオンにすれば、AIボットはもうコンテンツにアクセスできなくなる。

 もちろん、AIボットは絶えず進化している。Cloudflareによると、この機能は有害なボットの「フィンガープリント」を検知するため、やはり自動的に進化するという。

 新ツールは米国時間7月5日からすべてのCloudflareユーザーを対象に提供されている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
医師・看護師が遠隔管理できる在宅透析用AIモニタリング「PD Doctor’s Eye」のMETRICAが1億円調達
ヘルステック
2021-08-12 15:03
再編を迫られるスマホ業界を牽引する見本市MWCは、また同じことの繰り返しになるのか?
IT関連
2022-02-28 19:10
新世代のカスタマーケアへと変革する企業を支援–Zendeskが国内事業戦略
IT関連
2021-06-14 09:59
日本人の赤ちゃんの顔の「かわいさ」には客観的な特徴があった―日本版かわいい乳児顔データセット公開
IT関連
2022-02-23 02:15
第6回:ビジネスの革新に不可欠なデータファブリック戦略
IT関連
2021-06-10 15:37
鹿児島県庁、職員が使うネットワークシステムでコンテンツを無害化
IT関連
2023-03-17 11:51
「Mac」生誕40周年–創造性の最先端を走り続ける進化の歴史
IT関連
2024-02-02 08:05
三井住友FGと電通、“金融ビッグデータ”活用で新会社設立
DX
2021-07-09 20:47
東京大学と農研機構が作物の品種改良を行う育種家の感性を解明、柑橘類の皮の剥きやすさと実の硬さを深層学習で定量化
IT関連
2022-02-15 07:21
コーチング習得プログラム「CoachEd」が1億円超を調達、システム開発・マーケティング体制強化
EdTech
2021-01-30 23:21
生成AIは「もろ刃の剣」、米議員がリスク調査を会計検査院に要請
IT関連
2023-06-27 15:24
月面活動に向け衛星コンステレーション構築を目指すアークエッジ・スペースがシリーズAファーストクローズとして16.7億円調達
IT関連
2022-01-27 00:25
「IOWN」構想は何を可能にするのか?–NTTの狙い
IT関連
2022-12-07 11:56
中国のロボットタクシーユニコーンのWeRideが5カ月で660億円を超える資金を調達
モビリティ
2021-06-25 07:36