kaggle

kaggleの画像コンペbengali-aiに参加して

2, 3月の春休み期間を使ってkaggleのbengali-aiに参加をしました。

本格的にkaggleに参加するのは今回がはじめってだったので、気合いをいれて参戦していました。

コンペティションの目的

コンペティション目的はベンガル語の文字認識です。

ベンガル語には文字を構成する要素が大きく分けて3つあるらしく、それぞれ文字がどの要を持っているのかをクラスごとに分類する問題でした。

僕は、研究所の先輩と一緒に2人で参加をしました。

評価指標

F1スコアをそれぞれの要素ごとに重み付けをしたものでの評価を行います。

結果

結果は、2063チーム中、505位という、なんとも、微妙な結果に終わってしまいました。

上位25%ではあるのですが、正直、入賞していなければなにも意味はないのでとても、ショックです。

試したこと

  • GridMask
  • cutmix
  • cutup
  • center-loss
  • Test Time Augmentation(TTA)

です。

使用したモデルは

  • se-resnext50
  • se-resnext101

です。

学習環境はgoogle colabolatoryで行っていました。

最終的に一番良かったモデルは

se-resnext50に対して

  • cutmix
  • cutup
  • TTA

を行ったモデルでした。

感想

google colabolatryのセッション切れる問題がかなりストレス。

これはみんな共通で悩まされている問題だともいます。

はやくGPUを購入しなければと痛感しました。

 

もっと、discussionを反映させれるようにしたい!

今回は、discussionで効果があると話題になっていたものを参考に、簡単なところから順番に実装をしていきました。

200epoch計算するなど、あったのですが、とても自分の計算資源では実験することができなかったです。

これは、全てのモデルをLBで確認しようとしていたからだと思います。

 

サンプルデータを減らして、CVで検証をする。

CVが高くなったモデルで最終的に全ての学習データを使うという順番にしないと、スピード感もって実験することは難しいということを学びました。

最後に

もっと高い順位を目指したい。

4月から大学生としては最後の年度が始まります。

この1年でkaggle master となれるように挑戦していきます!

これからもよろしくお願いします!

オススメのプログラミングスクールをご紹介

タイピングもままならない完全にプログラミング初心者から

アホいぶきんぐ
アホいぶきんぐ
プログラミングってどこの国の言語なの~?

たった二ヶ月で

いぶきんぐ
いぶきんぐ
え!?人工知能めっちゃ簡単にできるじゃん!

応用も簡単にできる…!!

という状態になるまで、一気に成長させてくれたオススメのプログラミングスクールをご紹介します!

テックアカデミーのPython+AIコースを受講した僕が本音のレビュー・割引あり! というプログラミング完全初心者だった僕が Tech Academy(テックアカデミー)のPython×AIコース を二ヶ月間...

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です