はじめまして、ともぞうです。
はじめに
2024年7月からクラスメソッド社の機械学習チームの一員としてジョインしました、ともぞうです。
よろしくおねがいします。
これまでの仕事
新卒で人材会社に入社し、2年半勤めていました。
業務内容として、AWS・Google Cloudのクラウドサービスを用いた、ETLプロセスの設計・実装から機械学習モデルを組み込んだ予測パイプラインの保守・運用を主に取り組んできました。
もともとインフラに興味があったわけではなく(むしろ訳が分からず目を背けていた)、データ分析や機械学習コンペが好きな人間でした。
しかし、作ったモデルを実運用させるためには、
- 学習ないしは予測に使われるデータを抽出/変換/書き出すシステムを作って…
- そのモデルをのせるためのインフラ基盤を作って…
- そのモデルは時間とともに劣化することがあるのでそのための監視システムを作って…
- その監視システムが作動したら自動で再学習するシステムを作って…
などなど
自分が把握していなかった課題がたくさんあることを目の当たりにしました。
いまインフラ分野に足を踏み入れないと毛嫌いして一生避けてしまうだろうなと思い、機械学習周りのインフラ業務に手を挙げました。(この分野の経験を積ませて頂いた先輩社員・会社にはとても感謝しています。)
入社に至る経緯や入社を決めたきっかけ
クラスメソッドを知るきっかけは、Developers IOが始まりでした。
前職でインフラ周りがちんぷんかんぷんで、公式ドキュメントの読み方もわからない自分は何度もDevelopers IOに助けられてきました。
そこから手元で少しずつ実装ができるようになることで、AWSのサービスに触れること・資格勉強をすることが楽しくなりました。
そんな中、AWS関連の記事を漁っていると、ふと「Japan AWS All Certifications Engineers」という記事を発見しました。
それはAWS認定資格を全て保持しているエンジニアを対象とした表彰プログラムであり、クラスメソッドに所属している方が1年で100名以上表彰されているのを見て驚きました。
これをきっかけにクラスメソッドがAWS全認定資格の保有者数が国内1位だということを知ったのです。
そのような精鋭の技術者が集まる環境で自分も働きたいと思う気持ちが強くなり、ご縁があって入社させていただくことになりました。
これからやっていきたいこと
二つあります。
一つ目は機械学習のPoCや運用を”とにかくラク”にする機械学習基盤を作ることです。
機械学習プロジェクトを遂行する際には、大きく「研究実験フェーズ」と「運用フェーズ」の二つがあると思います。
研究実験フェーズで課題だと考えている、「開発環境(計算リソース)の準備」、「試行錯誤した実験結果の管理」を、
運用フェーズで課題だと考えている、「モデルの再学習」、「デプロイ」、「モデルの性能監視」をより迅速に、より自動化できるようにしたいです。
MLエンジニアがコア業務を全うし、パフォーマンスを最大化できるよう、自分はOps関連業務の最適化を目指していきます。
二つ目は数値データにとどまらず、テキスト・画像・動画といった非構造化データから分析業務を通じて効果的な施策を見出すことです。
数値データに比べて、非構造化データは収集しやすい。
一方で、数値データに比べて、非構造化データは分析は難しい。
このジレンマを解消することを一つの目標とし、インフラ業務だけでなく分析業務にも足を踏み入れていきたいです。
以上、二つの掲げた目標に対して、その過程で得た知識や成果を情報発信するように精進していきます。