everyday-kaggle-news

入門者・初学者向け

本ページでは、Kaggle の入門者・初学者向けの情報を掲載します。

Kaggle とは?

Kaggle は、データサイエンス技術を駆使したコンペが開催されるプラットフォームです。 企業や研究機関などが提供するデータに対して、世界中から集まる参加者が機械学習モデルの性能を競います。 コンペに必要なユーザ管理・順位表・スコア計算などの機能が提供されており、主催者は比較的手軽にコンペを開催でき、参加者もより気軽に数多くのコンペに挑戦できる利点があります。 データサイエンスの流行と相まって認知度が高まっていき、通算のユーザ数は 2000 万人を超えています。

コンペはいつ開催されている?

Kaggle ではオンライン上で常にコンペが開催されています。 Kaggle 公式のコンペ一覧でも確認できますが、有志による X(旧 Twitter)の bot が有用です。

それぞれのコンペには、Kaggle 上での称号やポイントの対象の有無が設定されています。 称号やポイントの対象となっているコンペほど、より多くの参加者が集まります。

実行環境?

Kaggle では、Python や R が利用可能な Code(Notebook)環境が提供されています。 機械学習で頻出のライブラリがあらかじめインストールされている他、ある程度の範囲で自由にライブラリも追加できます。 一定の制限のもとで、GPU や TPU も利用可能です。

押さえておくと良い知識は?

Kaggle に参加する上で押さえておくと良い知識として、次のようなものが挙げられます。 主に中高生・高専生を対象にしたコンペが開催される「国際人工知能オリンピックでは、理論・実践面に分けて参加者に期待する知識を具体的にシラバス(日本語訳版)にまとめています。

理論・実践面をバランスよく学んでいくのは理想的な在り方の一つですが、Kaggle ではより実践面から機械学習に触れていきます。 必要最低限の情報を押さえた後は、コンペでの実践を通じて理解を深めていくのに適した環境を提供しています。

何を見ると良い?