未経験から日立のトップデータサイエンティストに–データ分析コンペで磨いた“実践力”

今回は「未経験から日立のトップデータサイエンティストに–データ分析コンペで磨いた“実践力”」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 2022年10月にスペインで行われた世界的なデータ分析コンペプラットフォーム「Kaggle」の世界大会において、日立製作所(以下、日立)の諸橋政幸氏が参加するチームが3位入賞を果たした。

 同氏はデータ分析の部署に異動となってから、これまで本業以外の時間で国内外のデータ分析コンペにエントリーして数多くのメダルを手にするとともに、データサイエンティストとしてのスキルを磨き上げてきた。データ分析コンペへの挑戦と自身のデータサイエンティストとしてのキャリアをどのようにリンクさせてきたのか、諸橋氏に聞いた。

 諸橋氏は、データから価値を生み出すデジタル事業「Lumada」を推進する日立において、データサイエンスのエキスパートチームである「Lumada Data Science Lab.」ならびにデジタルエンジニアリングビジネスユニット 「Data&Design Data Studio」に所属し、同社ただ一人の「シニアデータデザインエキスパート」という肩書を有して、独自の立ち位置でデータサイエンティストとしての活動を続けている。

 「年齢が上がるとマネージャーになって自ら手を動かさなくなるという形が一般的だが、私は技術専門職で直接の部下を持たず、今も現場に出てお客さまと対話し、自分で手を動かして分析の仕事をしている。それに加えて、社内で勉強会や相談会を開いてデータサイエンティストの育成やスキルアップに取り組むのが私のミッション」(諸橋氏)

 諸橋氏は、1999年に新卒で日立に入社。情報セキュリティ業務を8年担当し、金融事業部で4年間業務に従事した後、2012年に新設されたデータ分析/AI部署に異動となり、そこで初めてデータ分析の道へと足を踏み入れた。当時はビッグデータブームが始まったところで、各部署から1人ずつ抜てきされる形での異動ではあったが、年齢も30代後半に差し掛かる中で未経験のデータ分析の仕事をするに当たり、暗中模索でたどり着いたスキル習得のメソッドが、「案件の経験+データ分析コンペの参加」という方法論であったという。

 「データサイエンティストにはPythonのプログラミングやデータを使った技術的な作業だけでなく、その前段でお客さまとの対話力やビジネス力、コンサルティング力が必要になる。その上で、求められるスキルセットも途方もない量になる。ひたすら本を買いあさって勉強したが、付け焼き刃の知識だけでは不十分で、知識を生かすには経験しないとダメだと実感した。ただ実務だけだと経験できる件数が限られる。そこで、より多くの課題や生のデータに触れたいと思い、2015年からデータ分析コンペに参加するようになった」(諸橋氏)

 データ分析コンペでは、課題提供側として多くの大手企業や行政機関が課題を提示し、それに対して参加者が機械学習のモデルを作って分析を行い、予測の精度を競う。一般的な分析案件の場合、顧客と分析者が契約関係のもと1対1で分析をするのに対し、コンペの場合は間にプラットフォームの運営者が入る。

まず運営側が企業などから課題を集めてきて、そこに参加者が自由にエントリーし、分析モデルを作ってスコア競い、上位入賞者のモデルを発注者に返す仕組みだ。そのため発注者としては1社に頼むよりも優れた分析モデルが得られる可能性が高くなり、参加者も幅広い種類の案件に参加できるなど、Win-Winの枠組みが形成されている。

 特にデータサイエンティスト側には、モチベーションが高まる仕掛けが数多く用意されている。まず経験値を得るという部分では、普通なら正式に受注しないと触れられない生のデータに触れられる。その上で報酬としての賞金に加えて、データサイエンティストの競争心をくすぐるように、コンペごとに複数の上位入賞者・チームに金・銀・銅のメダルが付与され、取得状況に応じて「Grandmaster」「Master」「Expert」などの称号が与えられる。

 コンペの成績は全て公開されていて、これまでの参加実績などから決定される変動制のランキングがその都度表示されるため、技術者にとってはそれらが継続的に頑張り続けるためのモチベーションとなる。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
楽天ポイントの次世代プラットフォームにNewSQLのTiDBが採用決定。その背景と評価結果を楽天のエンジニアが解説[PR]
PR
2024-02-05 08:22
[速報]GitHub CopilotでGemini 1.5 Pro、Claude 3.5 Sonnetが選択可能に。OpenAIのGPT-4o、o1-preview、o1-miniにも対応
GitHub
2024-10-30 08:04
「Windows LSA」の脆弱性、米CISAが改めてパッチ適用を勧告
IT関連
2022-07-07 12:24
日本での製品開発や品質向上に期待–セキュリティのフォーティネット会長が会見
IT関連
2023-12-03 21:26
マイクロソフト、「Office LTSC」「Office 2021」のリリース予定など明らかに
IT関連
2021-02-19 10:56
最先端医療の中核を担う米メディカルスクールが推進するデジタル変革
IT関連
2023-01-27 20:12
三井物産、データマネジメント環境で新たな統合分析プラットフォームに移行
IT関連
2024-04-04 14:02
AIが広告を創る時代 心の動きや感情を見極めるのは人間の右脳?
IT関連
2021-07-16 23:53
ガートナー、ソフトウェアやクラウドの値上げ対策を発表
IT関連
2023-01-28 09:28
Terraformのフォークが「OpenTofu」としてLinux Foundation傘下で正式ローンチ。OpenTFから改名
DevOps
2023-09-21 22:40
NTTぷららとNTTロジスコで個人情報約800万件が漏えいの恐れ
IT関連
2021-07-03 12:23
セゾンテクノロジー、「HULFT10」のオンプレミス対応版を12月10日から提供
IT関連
2024-10-12 03:30
WebAssemblyランタイム「Wasmer 2.1」リリース。WASI用に仮想ファイルシステムを実装し、ブラウザでもWASIが利用可能に
Deno
2022-01-12 18:47
[速報]オラクル、シングルラックでOracle Cloudと同等の機能を備えたハードウェアを開発中。Oracle CloudWorld 2022
Oracle
2022-10-20 02:39