DOCTORAL DEGREE HOLDERS INTERVIEW [MY DECISION] - ここが原点、ここから未来。

解決が待たれる課題に、
最適解を。
真に“使える”技術を、
社会の当たり前に。

株式会社ELYZA
佐々木 彬さん
2018年3月 博士後期課程修了
博士論文タイトル
Incorporating Domain Knowledge into Stance Classification
(スタンス分類における領域知識の活用に関する研究)

「ほんとうに学びたいものは何か」。
“理転”で工学部へ、そしてNLPの世界へ。

「人生は選択の連続」とはシェイクスピアの言葉だそうですが、人は朝起きてから寝るまでに最大35,000回の決断をしているという研究もあります(ケンブリッジ大学バーバラ・サハキアンら)。私は現在、AIエンジニアとして自然言語処理(以下NLP)の研究・開発に従事していますが、ここに至るまでの間、いくつかの岐路に立ち、分水嶺を乗り越えてきました。私の学び・研究の道に最も大きな影響を与えた選択といえば、大学受験時の“理転”(文系専攻から理系専攻に転じること)をおいてほかにありません。

志望大学は、地元にあり、母校(高校)の出身者も多く、兄も通っていた東北大学ということで迷いはありませんでした。「就職に有利なのでは」という(今思えば)ぼんやりとした理由で経済学部を志望したのですが、不合格の憂き目に遭いました。ショックでしたが、期せずして「ほんとうに興味のある学問領域は何か」という問いに向き合うことになりました。コンピュータやソフトウェアを学びたい——それからは工学部を目指して、苦手意識のあった数学や物理と格闘しました。

私が所属していた学科では、学部4年生から研究室に配属されますが、数あるラボの中でも乾研究室の人気は群を抜いていました。時折しも機械学習の手法の一つであるディープラーニングが深化し、社会的にもAIが認知され、期待と注目を(憂慮をも含めて)集めていた時期でした。乾研究室を目指す優秀な学生がたくさんいる中、学部4年生から博士後期課程(以下、博士課程)までの6年間、同研究室で学究に励むことができたのは幸運でした。ただ大学院入試に際しては、かなり力を入れて勉強しましたし、緊張感をもって臨んだことを覚えています。

博士前期課程(以下、修士課程)では、テキスト中に含まれる地名・施設名を指し示す表現(場所参照表現)と実世界の特定の場所を対応づけるという研究に取り組みました。例えば「ヨドバシカメラに行った」という文だけでは、どこの店舗かわかりません。しかし、周辺文脈に含まれる特定の場所を指し示す表現(例えば「JR仙台駅近く」など)を解析することで、言葉と実世界を関連付けて理解することができます。テキストだけでは情報が言葉の中に閉じてしまいますが、場所という実世界(座標)に紐づけることで情報がリッチなものになります。

博士課程では、あるテキストを書いた人物が、とあるトピックに対して賛成か/反対かを予測するタスク(賛否分類)に挑みました。はっきりと肯定/否定を表現していなくても、前後の文脈を分析し、単語の採用傾向による賛否分類を行います。ごく簡単に言えば「こういう言葉を使う人は、この話題に対して好意的/否定的な傾向が強い」と推測するというものです。直接的にテキスト中で言及されていなくても、間接的に思考や志向が見えるのはとても興味深いですね。(※モデル学習に向けたデータやデータセットは、適法に収集することが求められています)。

社会・企業からの要請も高く。
様変わりする専門的人材としての博士号取得者。

博士課程への進学は、学部生の時にはすでに視野に入れていました。東北大学の工学部では、学部卒業者の約9割が修士課程に進学し、修了後は約9割が就職の道を選んでいます。しかし、博士号取得者は高度な訓練を受けた人材として、アカデミアだけではなく社会の幅広い分野で求められています。また、革新的なイノベーションを生み出していくためには、博士人材の深く広範な専門的知識や研究・開発力が不可欠です。さらに海外の研究者コミュニティの中にあっては、博士号取得者であることが大きな意味を持ちます。もちろん博士課程に進みたくても経済的な障壁があるという方もいると思います。大学には支援制度があるので、調べてみることをお勧めします。生成AI、NLPは今、“熱い”研究分野・領域です。チャレンジしてみる価値は大きいのではないでしょうか。

それでもやはり博士課程に進むというのは大きな決断です。私の場合は、乾研究室の先輩たち(ロールモデル)の活躍の姿が、背中を押してくれました。また、乾さん(編集室注:乾教授)をはじめとして教員・スタッフの方々が、とてもきめ細やかに丁寧に指導してくださったのも心強かったです。難しい研究課題に伴走し、学生を取り残さないシステム(スタッフ等)が整備されていました。広いワンフロアに教職員、学生がいて、声を掛け合い、議論・ディスカッションが始まる——そうした研究に対する真摯な姿勢に触れることで、おのずとモチベーションもアップしました。もちろん“三密”という言葉もなかった頃で、研究室に入り浸っていたことも懐かしい思い出です。風通しの良い、またエネルギーに満ちた「場所」にいられた経験は、私の財産になっています。

「これまで誰もやっていないことに挑もう。世界のトップレベル、最先端を目指そう」というのが乾研究室の教職員や学生が共有していた研究ポリシーでした。一方で、これは産業界(民間企業)に就職した多くの博士人材が感じることだと思うのですが、企業では社会実装、そして業績・利益向上を果たせるような研究テーマが与えられます。ユーザーニーズをカタチに、さらにフィードバックを得て、ブラッシュアップしていく…という取り組みはダイナミズムあふれるものだとは思いますが、大学のように個人的な好奇心や興味に従って、という研究は難しくなります。そういう意味でも、学部・修士・博士と、研究テーマは異なりましたが、同じ領域で連続性をもって新規性あふれる研究に挑めたことは私の財産になっています。

技術の改善・向上が与える会社の業績、社会へのインパクト。
だから研究・開発はおもしろい。

博士課程在籍中に見聞を広げられたことの一つに、のちに就職することになる企業((株)リクルート)での就業体験があります。ここでは人材系のセクションで、レコメンド改善、各種予測施策、検索改善といった開発に従事しました。NLPというよりはデータサイエンスの領域ですね。かねてより個人的にデータ分析コンペなどに参加していた私にとって、データサイエンスの面白さ、それに将来性と可能性を再発見する好機となりました。新しい分野の専門性を養うのはたいへんでは、と思われがちですが、これまで培ってきた研究者としての技術や要領が土台にありますから、あとは意欲で前進するのみです。自身のキャリアプランの戦略としては、NLPを柱に、いくつかの専門性の高い分野を持ちたいと考えています。柔軟性をもって…というと聞こえはいいですが、私は少し飽きっぽい性格でもあるのですね(笑)。

社会で働いて感じたことは、データ分析がビジネスに及ぼすインパクトです。ひとつのデータ活用施策が、ユーザーの行動に何らかの影響を与えうる、そしてそれが営業/販売実績につながっていく。そうした成果を目の当たりにできるのは、開発者としての喜びでもあり、やりがいでもありました。ですが次第に、もっと自分が手掛ける領分を広げたい、自分の裁量でできることを増やしたいと思うようになったのです。そこで縁あって、現在の会社((株)ELYZA)に転職することに。同社は、東京大学・松尾研究室発のスタートアップで、若手の元気なスタッフが切磋琢磨し、未踏の問題の解決を目指しています。まだここにない、新しいものを生み出そうという大志を抱きつつ、同時に引きも切らない要求に呻吟しながらの日々です。

NLPは技術の進歩がとても速い世界であり、次々と発表される情報の量も膨大です。内容に関していえば玉石混交であり、1週間もしないうちに陳腐化してしまう例も少なくないのです。風化に耐える価値ある情報にキャッチアップするのは容易なことではありません。(株)ELYZAが主催するNLP勉強会コミュニティ『NLP Hacks』は、知見の共有や実装に向けた議論を行う場であり、私が運営を担当しています(2023年7月現在、一時活動休止)。私自身、学生時代からさまざまなNLPコミュニティに参加させていただき、そこで多くの貴重な気づきを得ました。ですから少しでも恩返しをしたいという気持ちもあります。

大規模言語モデルがもたらすAIサービスは、現在のところChatGPTを始めとする“黒船”が大きなアドバンテージを有していますが、解決が待たれる課題も多くあります。ピンチはチャンス。真に有用で実際的、私たちの社会や暮らしに役に立つ言語生成AIを世に送り出し、そうした存在を「当たり前」のものにしていきたい……ゴールはそう遠いものではないはずです。

(2023年7月 インタビュー)

略歴

2013年3月 東北大学工学部情報知能システム総合学科卒業、2015年3月 東北大学情報科学研究科博士前期課程修了、2018年3月 同研究科博士後期課程修了。博士(情報科学)。2018年4月〜2021年12月 株式会社リクルートにて人材領域のデータ活用施策の推進を担当、2022年1月〜 株式会社ELYZAにて自然言語処理の研究開発を担当。2015年 RECRUIT CHALLENGE FOR STUDENT 3位、2018年 統計数理研究所第3回データ分析ハッカソン優秀賞、2020年 kaggle: Mechanisms of Action (MoA) Prediction 4位(4,373チーム中)等を受賞。