2, 3月の春休み期間を使ってkaggleのbengali-aiに参加をしました。
本格的にkaggleに参加するのは今回がはじめってだったので、気合いをいれて参戦していました。
Contents
コンペティションの目的
コンペティション目的はベンガル語の文字認識です。
ベンガル語には文字を構成する要素が大きく分けて3つあるらしく、それぞれ文字がどの要を持っているのかをクラスごとに分類する問題でした。
僕は、研究所の先輩と一緒に2人で参加をしました。
評価指標
F1スコアをそれぞれの要素ごとに重み付けをしたものでの評価を行います。
結果



結果は、2063チーム中、505位という、なんとも、微妙な結果に終わってしまいました。
上位25%ではあるのですが、正直、入賞していなければなにも意味はないのでとても、ショックです。
試したこと
- GridMask
- cutmix
- cutup
- center-loss
- Test Time Augmentation(TTA)
です。
使用したモデルは
- se-resnext50
- se-resnext101
です。
学習環境はgoogle colabolatoryで行っていました。
最終的に一番良かったモデルは
se-resnext50に対して
- cutmix
- cutup
- TTA
を行ったモデルでした。
感想
google colabolatryのセッション切れる問題がかなりストレス。
これはみんな共通で悩まされている問題だともいます。
はやくGPUを購入しなければと痛感しました。
もっと、discussionを反映させれるようにしたい!
今回は、discussionで効果があると話題になっていたものを参考に、簡単なところから順番に実装をしていきました。
200epoch計算するなど、あったのですが、とても自分の計算資源では実験することができなかったです。
これは、全てのモデルをLBで確認しようとしていたからだと思います。
サンプルデータを減らして、CVで検証をする。
CVが高くなったモデルで最終的に全ての学習データを使うという順番にしないと、スピード感もって実験することは難しいということを学びました。
最後に
もっと高い順位を目指したい。
4月から大学生としては最後の年度が始まります。
この1年でkaggle master となれるように挑戦していきます!
これからもよろしくお願いします!
タイピングもままならない完全にプログラミング初心者から
たった二ヶ月で
応用も簡単にできる…!!
という状態になるまで、一気に成長させてくれたオススメのプログラミングスクールをご紹介します!


