中国ネット企業でLLMの開発競争が激化–その裏には学生使い捨ての現実

今回は「中国ネット企業でLLMの開発競争が激化–その裏には学生使い捨ての現実」についてご紹介します。

関連ワード (中国ビジネス四方山話、開発等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 米国テック企業の後追いをするように、中国ネット大手の阿里巴巴(アリババ)、百度(バイドゥ)、騰訊(テンセント)、字節跳動(バイトダンス)、華為技術(ファーウェイ)、小米(シャオミ)らが大規模言語モデル(LLM)と、それを活用したサービスを次々とリリースしている。

 各社は差別化を図るべく、消費者向けの文書作成サービスやスマートスピーカー、ビジネス向けクラウドサービスに組み込んだり、さまざまな企業のニーズに応えるため業界特化型のチャットボットを構築したりしている。

 LLMをはじめ、人工知能(AI)モデルの学習には、テキストや音声、画像などのデータにタグ付けや分類を行う「アノテーション」が必要になる。最近では、この作業に有能な大学生インターンを活用しているのだという。

 これまでも、AI学習用のアノテーション作業は、学力などを問わずに地方都市の低賃金労働者を多く雇い入れていた。中国政府人社部が2021年に発表した「人工知能トレーナーの国家職業技能基準」によると、AIトレーナー(アノテーター)の一般的な学歴は高校卒業程度となっている。河北省、河南省、山東省、山西省など伝統的に労働集約型産業が集まる地域に拠点が点在し、中には貧困解決プロジェクトとして山間部に施設があるケースもある。

 そこでは、「ゴールドファーマー」と呼ばれるオンラインゲームのプレイ代行業者やネット検閲業者と同様に、幾つも並べられたPCの前で労働者が淡々と作業をしている。大量にある画像の仕分けや、文章構造の解析・分類など、単純作業をひたすら行うというものだった。

 だが、最近は状況が変わってきた。人間のフィードバックによる強化学習が用いられるようになり、アノテーターは正しいフィードバックをしなくてはならなくなった。つまり、これまでのような単純作業ではなく、質問に対する正しい回答を返さなくてはならない。既存のデータ処理だけでなく、一般常識や経済・法律などのさまざまな専門知識も必要となる。英語力も求められる。そこで、中国のネット大手は英語にも長けた高学歴人材をインターンに募集している。

 例えば、英語専攻の大学生/大学院生が中国のネット大手企業に能力を買われ、話題のAIサービスの開発に携われるとすれば、喜んでインターンに応募するだろう。しかし、実際は学生らが思い描くような華々しいサービス開発の現場とは程遠く、コンピューターと向き合って質問と回答を延々と繰り返すというものだ。その様子は、地方都市の雇用創出で紹介されるAIのラベル付け作業者そのものだ。

 AIモデルの最適化のためにアノテーションの仕様が変更になることもあり、一からやり直しになることも日常的にあるという。プロジェクトの詳細は企業秘密のため明らかにされず、同僚がどれだけいるのかも、どのようなことに役立つのかも分からない。日給は食事付きで100~150元程度と作業内容の割に安く、会話も原則禁止されている。

 このように、希望を胸に抱き、名のあるネット企業に体験入社した学生はあっという間に辞めていくが、そのネームバリューから次々と新たな人員が補充される。中国で真っ先にLLMをリリースしたバイドゥは以前、海南省海口市にあるLLMのアノテーション拠点に数百人のアノテーターがおり、全員が学部生だとコメントしたことがあった。

 インターン体験者がどんどんと辞めていく中、それでも生き残って上級職への道を切り開いたケースもある。この過酷な環境を体験したほとんどの人が超有名企業で働くことを諦め、もっと小さな企業でやりがいを感じながらのびのびと働くことを選ぶそうだ。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
グーグル親会社Alphabet、産業ロボット用ソフト企業Intrinsic立ち上げ–研究部門「X」発
IT関連
2021-07-26 11:19
出産やメンタルヘルスなどデリケートな問題のケアを女性が受けやすくするバングラディシュのMayaが約2.3億円調達
ヘルステック
2021-03-07 07:42
スクエニ、堂本光一さんとコラボ 新アルバムに映像制作と作曲で参加
くらテク
2021-04-20 16:42
BLEスキャンでバスの混雑度を計測 専用サイトにリアルタイム表示 ナビタイムが実験
企業・業界動向
2021-01-13 15:58
アップル、「ロックダウンモード」の詳細を公開–国家の支援を受けたスパイウェアに対応
IT関連
2022-07-09 09:21
TikTokがユーザーがコメントもできるストーリー機能のパイロットテストを実施中
ネットサービス
2021-08-06 09:50
台湾の水不足でわかるテックへの気候変動の脅威
EnviroTech
2021-03-13 00:49
AI活用で5G網を自動復旧させる実証実験–KDDI、日立、NEC、OKIが共同
IT関連
2021-02-11 21:18
不動産バーティカルSaaSに見るアーキテクチャーと開発体制の変革、意思決定・実行プロセス
IT関連
2024-10-04 03:34
Red Hat、開発者向けポータルサイト構築ツール「Red Hat Developer Hub」正式リリース。オープンソースのBackspaceがベース
CI/CD
2024-01-24 15:10
健康なくして活躍なし–NECがヘルスケアサービスで実現する、真の多様性
IT関連
2022-12-20 10:11
日本IBM、独自LLM「Granite日本語版」を提供–日本語の長文を効率的に処理
IT関連
2024-02-29 22:34
日本保健医療大学、AI活用の文字起こしサービスで発言録の作成工数を最大7割削減
IT関連
2022-11-19 13:46
ビッグローブ、オンプレミスのOracle DatabaseからAmazon RDS for Oracleへ移行
IT関連
2023-11-22 12:10