GRANVALLEY
データであなたの「ミチ」をてらす

GRANVALLEY

ブログBlog

機械学習モデルコンペティション Kaggle 参加で得た「大切なスキル」とは

AIコンサルティンググループの社員が、今、自己研鑽や腕試し、はたまた賞金狙い?のため取り組んでいる機械学習モデルコンペティション「Kaggle」について取り上げたいと思います。

本記事はKaggleというワードは知っているが、実際に参加したことがない、どういうものかわからない、といった方を対象としています。特に、参加したいが一歩踏み出せないといった方の背中を押せることができたらと思い、本記事を作成しました。Kaggleの概要と私自身がKaggleをやってみて感じたことがメインのため、具体的なKaggleの登録方法やコンペティションの参加方法などは割愛しております。

グランバレイにおけるKaggleの取り組み

Kaggleとは世界最大の機械学習モデルのコンペティションサイトです。

現在、AIコンサルティンググループの社員数名がKaggleのいくつかのコンペティションに参加し、機械学習モデルの精度を競い合っています。最近は、「Santander Customer Transaction Prediction」というコンペティションに2名が参加し、2名ともシルバーメダルを取得しました。Kaggleに参加することによって、日々、機械学習の勉強を楽しみながら(苦しみながら)やっています。また、Kaggleで得られた知見などは、社内の勉強会で共有したりしています。社内の打ち合わせでも、Kaggleの結果どう?結果をミーティングで発表しない?といった会話が時々とんだりします。

「自分の実力を試せる」Kaggleとは

「自分の実力を試せる」Kaggleとは

Kaggleは、分類問題や回帰問題、画像処理、自然言語処理など、さまざまな課題が提示され、世界中のデータサイエンティストがその課題に対する機械学習モデルの精度を競い合っています。データサイエンティストの中には、個人だけでなくチームや組織で取り組んでいるところもあります。最近では、率先してKaggleに参加を推奨している企業もあります。グランバレイは、仕事に差し支えがなければ業務中に取り組んでもOKなので、私も業務に余裕があれば参加しています。

Kaggleになぜ参加するのか?

なぜ世界中のデータサイエンティストがKaggleに参加し、競い合うのでしょうか?
考えられる理由は、以下ではないかと考えます。

自分の実力を世界レベルで試すことができる

日々の業務の中では、自分の実力がデータサイエンティストとして、どれくらいあるものなのか、ということを把握することは難しいです。Kaggleでの実績=データサイエンティストの実力、ではないですが、少なくとも、自分の実力を測る一尺度として、Kaggleでの実績というのは使えると思っています。

さまざまな課題を通して自身のスキルアップにつなげることができる

Kaggleにはさまざまな種類の課題(分類、異常検知、画像処理、音声処理など)があります。これらの課題を解く中で、業務では得られない経験やスキルアップができると思います。

名声となる「メダル」がもらえる

Kaggleでは上位の成績を残したり、良いソースコードを共有したり、良いディスカッションをするとメダルがもらえます。このメダルがデータサイエンティストの一つのステータスとなっているため、多くのデータサイエンティストがしのぎを削ってKaggleにサブミット(回答の提出)を行っています。

成績上位者には賞金が提供される

Kaggleで出される課題の多くは、機械学習を使って何か問題を解決したいと考える企業です。企業はKaggleという場所を使って、世界中のデータサイエンティストに機械学習モデルを作ってもらい、その対価として賞金を支払うという構造になっています。そのため、コンペティションによっては成績上位者に賞金がでるものもあります。

アイデアが必要!Kaggleに参加して感じたこと

私がKaggleに参加してみて感じたことは、「初心者でも参加できるが、上位を取るためには知識とアイデアが必要」ということです。Kaggleでは参加者同士がディスカッションをしたり、ソースコードを共有したりすることができます。共有されたソースコードなどを参考にすることで、初心者の方でも意外と簡単に機械学習モデルの構築や解答の提出ができてしまいます。

ただし、精度をアップさせるためには、ソースコードを理解し、自分なりにアレンジしなければいけません。そのためには、機械学習の知識が必要になってきます。

さらに上位を狙うとなると、知識だけではなくアイデアも必要です。
他人と同じやり方では、他人と同じような精度しかでないため、いかに独自のアイデアを加えるかというのが、上位を狙うためには重要であると感じています。そして、そのアイデアを考える時間が、私は最も楽しいと感じました。

まとめ

Kaggleという機械学習のコンペティションサイトでは、世界中のデータサイエンティストが参加しています。そこでは、機械学習モデルの精度の競争だけでなく、ソースコードの共有やディスカッションが行われています。データサイエンティストの人はもちろんのこと、機械学習に興味がある、仕事にしてみたい、という方でもぜひ勉強になると思うので、Kaggleをのぞいてみてください。

https://www.kaggle.com

最後までお読みいただきありがとうございました。


本記事は、弊社AIコンサルティンググループが運営している「note」内の「AIグループ@グランバレイ」の記事を一部修正を加え転載しております。
https://note.com/gvaiblog/n/n11f72b0f4082

※ その他の会社名、製品名は各社の登録商標または商標です。
※ 記事の内容は記事公開時点での情報です。閲覧頂いた時点では異なる可能性がございます。