未来永劫

メリーバッドエンドが好きです.

9月と10月

生きてます.

研究室のあれこれ

研究室での運用は難しいという話.
個人的にはそれくらいの周辺知識は持っていてほしいなと考えるわけですが,難しさも当然あるなと思う.
特にM2,B4は一部を除いて基本的に研究室に来ないので彼らとのコミュニケーションはまず諦めないといけない.
加えてそんな彼らに対して指導をすることは一学生の身分では不可能なので,研究室を脱出する以外の方法はないと思った.
未来の明るいB3生の研究室配属が決まったので,個人個人のパワープレイで殴っていける組織教育をしていきたい所存.


リスペクトし合えない文化は嫌いという話.
他所の組織を貶すのも構わないが,発言には責任を持ってほしい.

その他大学院の話


基本的に弊大学院は他所の大学院と比較して卒業に必要な取得単位数も多く,面倒な課題も多い.
上記のツイートは学内での自身の研究発表に対して受けたレビュー(質問用紙)に回答するレポートの話(必修).
研究発表をする以上は議論がしたいので,分からなかったという当日の質問は基本的に歓迎.
が,分からなかったことを分からないとコメントだけされても,何が分からなかったのかが分からないので非常に困る.
要はロクでもない課題を出すなということ.

slack障害時

みんな帰りたいのだと思った.

研究や面白い論文の話

いわゆる最適化問題を解くという問題に帰着した.

Y.Ito, S.Oeda, and K.Yamanishi: “Rank selection for non-negative matrix factorization with normalized maximum likelihood coding." Proceedings of SIAM International Conference on Data Mining (SDM2016), pp:720-728, Mar. 2016.

NMFなどの行列因子分解では行列を分解する際に適切なrank数(何行何列の行列に分解するか)を設定する必要がある.
人間や専門家が決定したrank数は情報理論的に正しい根拠がなく,専門家が決定した内容が正しいとは限らない.
そこで情報理論における符号化長の決定に用いるNML(正規化最尤符号化長)に基づいて推定できないかという話.

情報理論に基づいた推定方法はAIC,BIC,MDLなど様々なものが存在するが,どの手法も潜在変数(この場合,rank数が潜在変数となる)が含まれる場合は適切なパラメータを決定することができない.
そこでこの研究では完全変数化という方法を用いて観測変数と潜在変数を同時に現れるものとし,rank数の決定に応用している.

潜在変数の現れる非正則なモデルを情報理論に基づいてどう求めるかは山西先生の文献が参考になった.*1

仕事などの話

9月

メルカリのインターン期間は8月いっぱいであったが,無事に成果を出せたこともあって長期バイトという扱いに変化した.*2
会社では同期の行なっていた業務の内容を引き継ぎ,精査された本番環境にデプロイするところまでを行なった.
久しぶりにPRレビューバトルを行なったがコメントは余裕で100件以上指摘していただいた.
自分にこれだけの時間を割いてくれるのもありがたいですが,それ以上に質の良いものを本番に持ってくというプロフェッショナル精神とマンパワーに圧倒される1ヶ月だった.
特に平気な顔してすごいことをやってのける人ばかりで,まだまだ自分は未熟だしエンジニアリングも足りてないなと思った.
「データサイエンスを扱ってる人は会社によっては分析だけが仕事になる場合があるが,君は機械学習エンジニアなので,エンジニアリングも徹底して出来る人になってほしい.素養あるし頑張って.」と,終わらないレビューで凹んでいた自分に対してメンターさんから激励をもらった.
期待に応えられるだけの地力を残りの学生生活でも身につけられるように勉強する.

そのほかに,会社に居て良かったなと思うのはベースラインとしてよく用いられるナイーブベイズ君を好きになったこと.
分類に深く影響する特徴量の影響度合いを調べるのも簡単だし,何より早い安い旨いの3拍子揃ったようなイケてるやつだなと思った.
全然利用していなかったがclass_weightもデータによってはいい影響を及ぼすものもあって,それぞれのオプション引数も深掘りしていくと面白いなあと思った.

10月

絶賛無職.*3
丸々2ヶ月間,ぶっ続けで会社で働いていたので,筑波に帰ると鮮度のいい情報を追っていくのも大変だし,何よりクリエイティブなことが少なくてフラストレーションが溜まることが多々あった.

それと,10月末にBOLDインターンシップという海外派遣のインターンに参加することが正確に決定した.
英語が喋れない(というかBroken English)なので抵抗なく会話できるように,まずはちゃんと英会話をやろうと思った.*4
ボストンに行こうと思うので,ボストンに知り合いがいる方がいましたら是非繋いでいただけると幸いです.

今月読んだ本

ビットコインとブロックチェーン:暗号通貨を支える技術

ビットコインとブロックチェーン:暗号通貨を支える技術

ブロックチェーン周りの教養は持っていて損がない.
なんとなく技術概要は知っていたがマイニングもしたいので体系的に勉強しようと思って買った.
ざっと見だけどエンジニア素養のある人は抵抗なく読めると思う.
情勢の変化が激しいのでこれ以外にも時事関連のキャッチアップを引き続き勉強する必要がある.あくまで手元にあると良いなって感じの本.

今月の目標

  • EMアルゴリズムの実装
  • DeepLearning本 8章をちゃんと読む
  • 英会話を週3以上やる
  • 残りの半分の日はRustで競技プログラミングの問題を解いていきたい
  • 誕生日をエンジョイする(昨年度送っていただいた方でお返しもらってない! って人は是非一声おかけ願います)

amzn.asia

*1:山西健司: 「記述長最小原理の進化:基礎から最新の展開」電子情報通信学会Fundamental Reiew, 第10巻第3号, pp:186-194, 2017.

*2:正確にはもっといい待遇

*3:請け負ってるタスクはあるが大したことないので実質無職

*4:週1でやってたけど頻度を上げようと思う