「楽観主義」「なんとかなるさ」——これが私の性格、価値観に最も近いかもしれません。似たような言葉に沖縄の「なんくるないさ」がありますね。元は「真(まくとぅ)そーけーなんくるないさ」という定型句で、「くじけずに正しい道を歩むべく努力すれば、自然と(あるべきように)なるものだ」という意味を持っているそうです。私の場合、一途に歩んできた「道」とは、自然言語処理研究でしょうか。人生の節目である高校受験、大学入試、就職活動…計画通りにはいかないことだらけでしたが、折々の人との出会いに導かれて、今こうして、日本語に特化した国産大規模言語モデル(LLM:Large Language Models)の研究・開発に従事しています。
私が初めて自然言語処理を知ったのは、学部3年生の時。授業で学んだのですが、「おもしろいな」と思いました。たとえばプログラミング言語は、文法やルールが厳密に決まっています。一方で、人が使用する自然言語は、自由で、曖昧で、比喩や暗喩があり、察してほしいニュアンスがあります。融通無碍なコミュニケーション手段ですね。それをコンピュータに処理させる、またコンピュータに「ことば」を教えるということはどういうものだろうと興味を持ちました。
学部4年生から自然言語処理の研究室(永田亮研究室)に所属し、大学院は奈良先端科学技術大学院大学の自然言語処理学研究室 (松本裕治研究室)に進学しました。松本先生は当該分野で非常に顕著な業績を残されている方で、私が入る前年まで乾さん(編注:乾健太郎教授。現在、東北大学言語AI研究センター教授、アラブ首長国連邦MBZUAI Visiting Professor)が准教授として所属しておられました。ここでは乾さんとの接点はなく、それから4年後の学会で突然声を掛けられ、東北NLPラボで共に研究するようになるのですから縁とは不思議なものです。
私が大学院の研究で最初にテーマに掲げたのは、非日本語母語話者による日本語のテキスト誤り訂正です。この研究は、ランゲージエクスチェンジ(言語交換:外国語を学びたい同士が母国語を教え合う)サイトから収集したデータセット(研究用に使用が許可されたもの)を基に進められましたが、ほどなく日本語特有の難しさが浮かび上がってきました。英語などは単語がスペースで区切られますが(分かち書き)、日本語の場合は単語境界の判断や品詞分類が困難なことが多かったのです。また、非日本語話者が記述する文章には、母音、長音などの表記もしばしば欠落しました。一方で、中国にルーツを持ち漢字を使用する人は、訂正のしやすさが違うという発見もありました。
こうして研究に励む一方で、前期課程修了後の身の処し方を考えなければならない時期がやってきました。
修士課程1年の後半になると、周囲の動きが慌ただしくなり、就活のシーズンに突入しました。私も「一応しておくか」という軽い気持ちで何社か受けましたが、捗々しい結果は得られませんでした。そのうち東日本大震災が起こり(2011年3月11日)、しばらくの間、企業側の対応が中断。そうこうしているうちに国際会議で発表する論文の準備(同年5月締め切り)などに追われ、就活どころではなくなってしまいました。気づいたら修士課程2年の冬…ということで、博士課程への進学を決めました。
一見、消極的な進路選択ですが(笑)、この行動が私の「その後」を決したといっても過言ではありません。それほどまでに博士課程における研究者としての成長と稔りは大きかったのです。
研究室では、小町守先生(助教、当時)の指導を受けながら進めていたのですが、私が博士課程2年生の時に小町先生は他大学に移られてしまいました。それからはどんなにタフな課題であっても単独で取り組まなければならなくなりました。厳しい研究環境に鍛えられ、ロジックを構築する思考力、論文の構成力・文章力などが大きく向上したように思います。さらにインターンシップで企業の研究開発プロセスを見聞できたのも貴重な体験でした。研究スタイルとしては大学のほうがずっと自由だという印象を持ちました。大学では、時間にかかわらず好きなだけ研究ができますし、私の場合は、プログラムにバグが見つかるとそれが気になって仕方がないというタイプなので、夜を徹して…ということも珍しくありません。しかし、企業では、働き方改革など様々な理由で残業を抑制しなければなりませんし、「○時までに帰るように」と告げられます。
これまで私は「ここで働きたい」という明確な望みを持ったことはないのですが、国際会議や学会、インターンで知己を得た方々に声を掛けられて、自分がやってみたい研究(仕事)の場を得てきました。これは博士課程に進んだからこそ得られた人脈です。
2014年7月、北海道の網走で自然言語処理研究会が開催されました。発表を終え降壇したとき、近づいてきた人物が…それが乾さんでした。言葉を交わすのはこれが初めてです。「研究室でポスドクを募集しているので、一緒に研究をしませんか」というお誘いでした。私は乾さんとは面識がありませんでしたが、研究者コミュニティのなかでは発表やアウトプットを心掛けており、それで目に留めていただけたようです。研究者にとっての「発信」は、いろんな人に知ってもらえる機会であり、新しい道をひらく端緒となりえます。
現在、私が研究・開発を担当している日本語に特化した国産LLMは国内最大級の規模であり、ChatGPTなど海外発の技術ではなく、日本の文化や商習慣を熟知した生成AIサービスの提供を目指すものです。
私は、一人でコツコツとプログラムを書くのが好きなのですが、会社では複数人で一つのプロジェクトに取り組むようになり、進行をチェックしたり、コードを相互レビューしたりといった仕事も増えてきました。経験を重ねる中で、少しずつ求められる職務が変わってきていますが、現場の最前線で頭と手を働かせて地味に作業をするのが性に合っていますし、何よりも自分自身が「楽しい」と思える営為です。
近年急速に普及している生成AIが、人が日常的に話している言語を理解できるようになり、より自然で情味あふれる会話や文章を生成できるようになれば、私たちの暮らしはさらに便利で豊かなものになるかもしれません。私が目指すのは、さまざまな種類の情報を利用して高度な判断をするマルチモーダルな音声対話です。私たちが話す言葉(音声)にはさまざまな情報が含まれます。喜怒哀楽だけではなく、「言外」という言葉の通り、多様な考えや感情が埋もれています。しかし、音声認識で書き起こしされると、文字が羅列されたテキストとして表現され、音声に込めた思いが使えません。人間がどのように(言葉や文章を)理解しているのかを推し量り、行間を補いながら推論・予測することはまだ難しいのですね。生成AIが、自然な速度、当意即妙な返事、相槌、時には割り込んだり遮ったりといった人間らしい音声対話ができるようになるまでには、まだまだ多くのボトルネックが存在しています。大規模言語モデルの研究開発において、私はマルチモーダルな音声対話の実現に興味を持っていますが、他の研究者は違うアプローチで探究をしていて、それが自然言語処理全体の底上げ、可能性を広げる力になっています。
これまでの私は、周囲の人の求めと勧めにより、キャリアを重ねてきましたが、それはすべて「チャンス」であったと言い換えることもできます。「変化」することに抵抗があっても、思い切ってチャレンジしてきました。それが結果として「今の場所」に運んでくれましたし、今後もまたまったく別の場所へと誘(いざな)ってくれるかもしれません。チャンスはそう多いことではありません。少しでもおもしろそうだと感じたら、また興味が湧いてきたら…勇気をもって挑戦してほしいと願っています。
(2023年12月 インタビュー)
2010年3月 甲南大学理工学部情報システム工学科卒業、2012年3月 奈良先端科学技術大学院大学情報科学研究科博士前期課程修了、2015年6月 同研究科博士後期課程修了。博士(工学)。2013年4月~2015年3月 日本学術振興会リサーチフェロー(DC2)、2015年7月~2017年3月 東北大学自然言語処理研究グループ特任助教、2017年4月~2019年5月 理化学研究所革新知能統合研究センター特別研究員、2019年6月~2022年4月 フューチャー株式会社、2022年5月~ LINE株式会社(2023年10月再編、LINEヤフー株式会社)、2023年9月~ SB Intuitions株式会社出向。2020年 言語処理学会第26回年次大会優秀賞、2022年 言語処理学会第28回年次大会優秀賞、対話ロボットコンペティション2022 Best Performance Award、対話システムライブコンペティション5シチュエーショントラック最優秀賞、対話システムライブコンペティション5オープントラック最優秀賞、2023年 対話ロボットコンペティション2023最優秀賞等を受賞。