インターンの勤務時間で自由研究できる!?機械学習未経験者が15時間でタイタニックの生存率を予測してみた感想!

こんにちは。Jisedai編集部の小笹です。

皆さんは「機械学習」という言葉を聞いたことはありますか?

最近、AIの発展により「機械学習」という言葉が普及しているようにも感じます。

そんな中、機械学習の勉強をこれまで全くしたことのない私が15時間学んでみましたので、感想をお伝えしようと思います。

※ちなみに、ディップでは「自由研究」の時間が認められているので、新しいことを勉強する時間もお給料が出ます(笑)今回はその自由研究のアウトプットとして記事を書いています。

勤務時間内に趣味開発ってアリなの?元バンドマンエンジニア芦野さんとRPAしくじり先生に「自由研究制度」について突撃取材してみた!!

2019年9月10日

機械学習に関する知識は?

私は機械学習というワードは聞いたことがありつつも、説明してみろと言われると、その言葉の通り「機械が学習する」としか言えない状態でした…。

また、「機械学習」と「AI」との違いも分からない状態。

そんな状態からスタートしました。

なぜやってみたのか?

自分の場合は機械学習が面白そうというよりも、タイタニックの生存率を予測できるプログラムを作ることが面白そうという感覚が優先して、機械学習の勉強を始めました。

実は自分は1年前に初めてプログラミングを勉強し始めて、その時に自分が作ったプログラムがPC上で動いてくれることがとても快感でした。

今回のタイタニックの生存率を予測プログラムを作ることに対してもワクワクがあって始めてみようと思ったのがきっかけです。

どのような壁にあたったか?

Techpitというサイトから機械学習の勉強を始めたのですが、最初からスラスラと理解できた訳ではありません。

[blogcard url=”https://www.techpit.jp/p/kaggle-python”]

機械学習を通して、私は3つの壁に当たりました…

①見本プログラムの理解(始めの5時間)

Pythonの基本的な使い方は理解していたものの、機械学習ならではのプログラム用語、書き方の理解に苦しんでいました。

なぜなら、機械学習では主にテーブルデータを扱って、処理していくのですが…

今まで、プログラミングでテーブルデータを扱ったことがなく、もちろん処理の仕方も分からなかったのです。

なので、機械学習で使われる処理方法を0から学び、理解し、覚えることに苦労していました。

②分割検証の理解(次の5時間)

やっと、簡単な見本のプログラムを理解することができ、次は予測精度を上げるための方法に入っていきました。

そこで、予測精度を上げるためのテクニック「分割検証」というワードがでてきて理解に時間がかかりました。

Techpitで分割検証の説明を書いているものの、どうもイメージがしにくく、自分には腑に落ちない部分が残っていました。

そんな時、機械学習に精通している社員の方に質問できる機会があり、納得のいく理解ができました。自分がインターン生として働いていなければ、もっと悩んでいたと思います。だからこそ、この環境にとても感謝しています。

90年生まれ28歳だけど新卒。ディップの清野ではなく清野がいるディップに。

2019年6月10日

③精度の高い予測をするのが難しい(最後の5時間)

なんとか分割検証というテクニックを用いて、タイタニックの生存率を予測するプログラムを書き、実行することまでできたのですが…

そこからはどこでも通用するようなテクニックなど存在せず、精度の高い予測プログラムをつくるには、とてもつらい道のりが待っていました…

というのも、自分の手で仮説をたてて、何度も検証することで少しずつ精度が上がっていくか否かを確かめていくしか方法が残されていないことを知ったからです。

予測するのにこのデータは不要、ないしは新たなデータを作る必要があるなど、自分で考えて進めていくのです。

この地道な作業がとても時間がかかる大変なものであると身に染みて感じました。

④機械学習に触れてみてどうだったか?

未だに満足できる高精度のプログラムを作れてないものの、この15時間を通して機械学習に対してより興味が沸いたことも確かでした。

なぜなら、自分で未来予知ができるのではないかと思ったからです。

例えば、天気予測プログラムや株式取引プログラムなど…

大学のレポート課題を簡単に処理してくれる自動レポート作成プログラムまでも作ることが出来るのではないかと、ワクワクしています。

これからの勉強方法として、kaggleのサイトを利用してコンペに参加して他人のプログラムと見比べ、競い合っていこうと考えています。

そして、これからも機械学習の勉強を続けて、自分の知的好奇心を満たしていきたいと思っています。

メンバー募集中!

ディップ次世代事業準備室では、一緒に働くメンバーを募集しています。
ご興味がある方、ぜひカジュアルにお話しませんか?下記リンクより、ご連絡待ちしております。

Wantedlyのアカウントをお持ちでない方

[blogcard url=”https://form.run/@openentry”]

Wantedlyのアカウントをお持ちの方はこちらからの方がスムーズです!

シェアもしてもらえるととても励みになります!