実践課程修了者インタビュー

基礎から応用・先端研究まで
貴重なアドバイスを受けることができました

Q. 最初に出身の研究科など経歴を教えてください。

私は東京大学大学院工学系研究科システム創成学専攻出身です。修士課程の時から「人の移動」に関する研究に取り組んでおりTwitterや交通系ICカードデータに含まれる位置情報のデータを分析していました。大学院入学時には、折角入学したからには単に研究に励むだけでなく様々なことに挑戦しようと思っていました。DSSもその一環で参加しました。DSS以外にはグローバルリーダー養成プログラムGSDM[1]に参加し所属研究科とは別の経済学研究科の渡辺先生からも指導を受けたり、博士課程在学中にキングスカレッジロンドン[2]にも半年ほど留学して共同研究をしました。東大在学時には非常に充実した研究生活を送れたと思っています。
[1] http://gsdm.u-tokyo.ac.jp/
[2] https://www.kcl.ac.uk/

前田 高志 ニコラス
理研AIP 因果推論チーム
特別研究員

Q. データサイエンスに興味を持ったきっかけはなんですか?

私は元々京都大学の理学部出身で大学入学時は数学に興味を持っていましたが、途中で社会に関心を持つようになり、4年生に進学する際に転学して文学部社会学専修に移りました。私は理数系と社会系にまたがる研究したかったのですが、当時は正直何をしてよいかわかりませんでした。それで学部卒業後は一旦就職しました。しばらく社会人をやっているうちにデータサイエンスという分野があることに気が付きました。私はこれは数学、情報学、社会学が重なる分野でまさしく自分が探し求めていた分野なのではないかと思うようになりました。また、データサイエンティストは社会的にも需要が大きいため大学院に進学することでキャリアアップになるのではないかとも考えました。その結果大学院進学を決めました。

Q. DSSに興味をもったきっかけはなんですか?

学内ポスターを見たのがきっかけです。丁度自分が博士課程に進学する頃にDSSも始まっていてポスターが学内に貼ってありました。また、自分が受けていた授業に演習講義の先生方が訪問されガイダンスをやられていたのも記憶に残っています。

Q. 基礎課程では何を学ばれましたか?またどの点が役にたちましたか。

次の3つの講義が特に記憶に残りました。

・アルゴリズムとプログラミング実践講座

この講義がよかったのは文系など他研究科出身者でもキャッチアップできるように授業が構成されていた点です。前述の通り私は理系出身ではありますがプログラミングが優れてできるというわけではありませんでした。そうした私にとってライブラリのインストールから始まり、実験結果のグラフ作成や、実験を簡単に再現し結果を整理するようシェルスクリプトを組んで実行順序を手順化するなど、本当に基礎から教えてもらったことは後々の研究生活でも非常に役立ちました。

・ソフトウェア・クラウド開発プロジェクト実践III

この講義はグループワークでハードウェアの組み立てからアプリケーションの開発までを実践する演習講義でした。私が所属したグループはプログラミングスキルが高い優秀な人が多かったので、非常に刺激を受けました。授業ではCPUやハードディスクを与えられ、それらを組み立て、Linuxをインストールすることから始め、その後で、自分たちで考えたWebアプリケーションをプログラミングして導入しました。私たちのアプリケーションは、スマートフォンで撮った自撮りの写真をアップロードすると、白黒化して漫画タッチに加工し、そこから自動で顔を判定し、吹き出しのついた漫画の顔が切り取られた箇所に自動で当てはめていくというものでした。

・先端人工知能論Ⅰ

GPU環境を与えられてディープラーニングを一から学ぶという講義でした。それまでディープラーニングをやったことがなかったので非常に勉強になりました。課題レポートで私はGoogle Street Viewの画像[3]を大量にダウンロードし各写真について、それが東京なのか京都なのかを当てさせるモデルを作りました。 [3] 現在は有料なので同じことをしようとする人は注意してください。

Q. 応用課程では何を学ばれましたか?

秘密保持義務があるのであまり詳しくは言えないのですが、金融系のデータを分析させてもらいました。演習講義もグループワークだったことが非常にためになりましました。私のグループは3人グループでした。作業分担としては2人は関連研究の実装をやって、私はその関連研究の理論をデータに当てはめる際にどの部分がうまくいきどの部分がうまくいかないのかを検証することが主な役割でした。結果としては理論と現実のデータを踏まえた上で、手法のうまくいく部分とそうでない部分を説明し、その理由をデータの特性から説明することができました。先方の担当者さんも喜んでいたので、良い結果を残すことができたのではないかと思っています。

Q. 実践課程での研究を初学者にもわかるようにお聞かせください

実践課程では「人の移動」の研究の一環として交通ICカードなど鉄道の移動データを用いた研究を実施しました。交通ICカードデータはデータ量はたくさんあるものの移動目的が登録されていないことが特徴です。つまり、移動目的さえある程度の精度でも推定できれば宝の山になるデータだとも言えます。そこで私は交通ICカードデータをうまくファクタリゼーションすることで人の移動目的は推定できることを示しました。推定結果に関しては実際のアンケートベースで集めたデータとの比較も行いました。こうして推定した人の移動目的の情報を用い、都市開発政策にも役立てられるような研究を実施しました。

Q. 卒業後の進路をお聞かせください

現在は理化学研究所革新知能統合研究センター(AIP)の因果推論チーム[4]で特別研究員として働いています。現在は因果推論の方法論の研究を中心に人の移動の研究も継続しています。両者を結びつけられる研究をめざしています。 [4] http://www.riken.jp/research/labs/aip/generic_tech/cause_infer/

Q. DSSで学んで一番よかったことを教えてください

アルゴリズムとプログラミング実践講座など基礎課程はプログラミングが苦手だったとしても順を追って勉強していけることが特徴です。応用課程では貴重なデータを触らせて頂き,また教員2名とTA2名による付きっ切りの指導体制では貴重なアドバイスを受けることができました。応用課程の醍醐味は企業担当者の前でのプレゼンができることで、企業の担当者の方々から実務的な立場からフィードバックをもらえたことが本当に嬉しかったです。実践課程ではいろんな先生に出会い、研究のアドバイスをもらえました。その結果自分が当初予定していたよりも価値のある研究成果にたどり着くことができ非常に満足しております。

Q. データサイエンス全般に関して今一番エキサイティングなトピックは何だと思いますか?

因果推論だと思います。これまでは、予測問題や識別問題がデータサイエンスにおいて主要な問題だったと思います。それに対して、因果推論はデータの生成過程を理解することを目的としていて、機械学習の手法の応用や高度化が期待されています。因果推論において機械学習を用いた手法を研究していくことで、社会や自然の現象を深く理解し説明することができるようになっていくことができると思います。私は今後ますます熱くなっていくトピックだと思います。

Q. データサイエンス全般やDSSに関して後輩に向けてメッセージを下さい。

データサイエンスは工学系や情報系でなくても人文系・社会科学系などでも使える手法が沢山あり、今の世界ではビッグデータも沢山あります。そのためバッググラウンドにとらわれずに積極的に関わっていくことをお勧めします。もちろん各分野に伝統的に使われている方法を無視して、データサイエンスにおける新手法ですべての問題を解決できるとは思いません。新旧の方法を融合させることで各分野における新しい発見が生まれることも往々にしてあります。視野を狭めずに自分の研究に適した手法を探求・開発していくのがよいと思います

DSSに参加してみませんか?

東京大学大学院の学生であれば誰でも履修できます。
情報理工学系研究科以外の学生の参加も歓迎します。