Notifications【お知らせ】
31st Annual Meeting of the Language Processing Society of Japan / 言語処理学会第31回年次大会 (NLP2025)
Members of the lab will give the following 52 presentations at the 31st Annual Meeting of the Language Processing Society of Japan (NLP2025) held in Nagasaki from March 10 to 14.
2025年3月10日から14日にかけて長崎で行われる言語処理学会第31回年次大会(NLP2025)において、Tohoku NLP メンバーが携わる下記52件の発表が行われます。
3/10(月)
チュートリアル1 3月10日(月) 13:00-14:30 A会場
- チュートリアル1:言語モデルの内部機序:解析と解釈
Benjamin Heinzerling (理研/東北大), 横井 祥 (東北大/理研), 小林 悟郎 (東北大/理研)
3/11(火)
P2:ポスター 3月11日(火) 10:20-11:50 ポスター2F
- P2-2 Representational Analysis of Binding in Language Models
○代 勤 (東北大), Benjamin Heinzerling (理研), 乾 健太郎 (MBZUAI/東北大学/理研AIP) - P2-6 LLMにおける内部表現を用いた日本語スタイル制御メカニズムの分析
○高橋 良允, 矢野 一樹 (東北大), 成瀬 健太, 武井 美緒, 梶 佑輔 (楽天), 鈴木 潤 (東北大) - P2-8 Transformer LLMにおける層単位のFFN層の重要度検証
○池田 航, 矢野 一樹, 高橋 良允, 李 宰成, 柴田 圭悟 (東北大), 鈴木 潤 (東北大/理研/NII) - P2-9 言語モデルのパラメータから探るDetokenizationメカニズム
○鴨田 豪 (東北大), Benjamin Heinzerling (理研/東北大), 稲葉 達郎 (京大), 工藤 慧音, 坂口 慶祐 (東北大/理研), 乾 健太郎 (MBZUAI/東北大/理研) - P2-13 「数」に着目したLLMの多言語能力の検証
○羽根田 賢和 (フューチャー/東北大), 岸波 洋介, 藤井 諒, 森下 睦 (フューチャー) - P2-20 言語モデルの内部表現における文法情報の局所性について
○佐藤 宏亮, 鴨田 豪 (東北大), Benjamin Heinzerling (理研/東北大), 坂口 慶祐 (東北大/理研)
Q2:ポスター 3月11日(火) 10:20-11:50 ポスター1F
- Q2-17 JHARS: RAG設定における日本語Hallucination評価ベンチマークの構築と分析
○亀井 遼平, 坂田 将樹 (東北大), 邊土名 朝飛 (サイバーエージェント/AI Shift), 栗原 健太郎 (AI Shift/サイバーエージェント), 乾 健太郎 (MBZUAI/東北大/理研) - Q2-25 議論形式のマルチエージェント自動評価の詳細分析
○内藤 悠, 佐藤 魁 (東北大), 佐々木 翔大 (SB Intuitions/東北大), 鈴木 潤 (東北大/理研/NII)
D4:テーマセッション2: 人とAIの共生に向けた対話システム・言語使用の研究(3) 3月11日(火) 14:50-16:20 D会場
- D4-2 多面的なユーザ意欲を考慮したセールス対話データセットおよび対話システムの構築と評価
○邊土名 朝飛, 馬場 惇, 佐藤 志貴 (サイバーエージェント), 赤間 怜奈 (東北大)
E4:テーマセッション6: 人文学と言語処理(4) 3月11日(火) 14:50-16:20 E会場
- E4-1 線形判別分析の PU 学習による朝日歌壇短歌の分析
○加藤 真大 (東大), 浦川 通, 田口 雄哉, 新妻 巧朗, 田森 秀明 (朝日新聞社), 羽根田 賢和, 坂口 慶祐 (東北大), 持橋 大地 (統数研)
P4:ポスター 3月11日(火) 14:50-16:20 ポスター2F
- P4-9 認知言語学的イメージスキーマの生成と解釈における大規模言語モデルと画像生成モデルの評価
○本田 恭平 (ブリヂストン), 松﨑 孝介, 吉田 遥音 (東北大), 坂口 慶祐 (東北大/理研)
Q4:ポスター 3月11日(火) 14:50-16:20 ポスター1F
- Q4-6 LLM事前学習の効率化と性質改善: 埋め込み層および出力層のパラメータ固定による再利用
○李 宰成, 矢野 一樹, 高橋 良允, 柴田 圭悟, 池田 航 (東北大), 鈴木 潤 (東北大/理研/NII) - Q4-10 モデル拡張によるパラメータ効率的な LLM の事前学習
○矢野 一樹 (東北大), 伊藤 拓海 (東北大/Langsmith), 鈴木 潤 (東北大/理研/NII) - Q4-17 Padding vs. Packing: 大規模言語モデルのファインチューニングにおける学習効果の検証
○塩野 大輝 (東北大), 田中 涼太 (東北大/NTT), 宮脇 峻平, 工藤 慧音, 鈴木 潤 (東北大) - Q4-18 Transformer LLMの内部挙動改善:隠れ状態ベクトルの数値的収束性の向上
○柴田 圭悟, 高橋 良允, 矢野 一樹, 李 宰成, 池田 航 (東北大), 鈴木 潤 (東北大/理研/NII)
3/12(水)
A5:NLPモデルの解釈可能性・分析(1) 3月12日(水) 8:30-10:00 A会場
- A5-1 層の冗長性と層同士の独立性に基づく言語モデルの層交換の成否の特徴づけ
○小林 春斗, 原 知正, 鴨田 豪 (東北大), 横井 祥 (国語研/東北大/理研) - A5-5 定数精度浮動小数点 Transformer Decoder が認識する言語の有限性・余有限性
○根岸 直生 (東北大), 谷口 雅弥 (理研), 坂口 慶祐 (東北大/理研), 乾 健太郎 (MBZUAI/東北大/理研)
C5:テキスト生成 3月12日(水) 8:30-10:00 C会場
- C5-6 LLM as a Debate Judge: 学習者ディベーターへの自動フィードバック生成
○尾崎 大晟 (大阪公立大), 市野 敬介 (NADE), 松田 拓, 久保 健治 (CoDA), 内藤 昭一 (リコー/東北大), 山口 健史 (東北大), 天野 祥太朗 (大阪公立大), 井之上 直也 (JAIST/理研), 中川 智皓, 新谷 篤彦 (大阪公立大)
D5:テーマセッション5: 言語とコミュニケーションの創発(1) 3月12日(水) 8:30-10:00 D会場
- D5-4 RNNの回帰行列を凍結しても統語構造の獲得は損なわれない
○上田 亮 (東大), 栗林 樹生 (MBZUAI), 神藤 駿介 (東大), 乾 健太郎 (MBZUAI/東北大/理研)
P5:ポスター 3月12日(水) 8:30-10:00 ポスター2F
- P5-6 ASCII CHALLENGE−LLMは画家になれるか−
○吉田 遥音, 羽根田 賢和 (東北大), 斉藤 いつみ, 坂口 慶祐 (東北大/理研) - P5-9 生成系タスクの自動評価においてチェックリストの使用は有効なのか?
○古橋 萌々香 (東北大/NII), 中山 功太, 児玉 貴志 (NII), 菅原 朔 (NII/NII)
A6:NLPモデルの解釈可能性・分析(2) 3月12日(水) 10:20-11:50 A会場
- A6-1 スパースオートエンコーダーを用いた大規模言語モデルのチェックポイント横断分析
○稲葉 達郎 (京大/NII), 乾 健太郎 (MBZUAI/東北大/理研), 宮尾 祐介 (東大/NII), 大関 洋平 (東大), Benjamin Heinzerling (理研/東北大), 高木 優 (NII)
P6:ポスター 3月12日(水) 10:20-11:50 ポスター2F
- P6-6 Anchoring を行う生成的関係抽出
○広田 航, 高橋 洸丞 (ストックマーク), Benjamin Heinzerling (理研/東北大), Qin Dai (東北大), 近江 崇宏 (ストックマーク), 乾 健太郎 (MBZUAI/東北大/理研)
Q6:ポスター 3月12日(水) 10:20-11:50 ポスター1F
- Q6-8 日本語文章の可読性評価のための項省略判断モデル
○久保田 智天 (東北大), 石月 由紀子 (フリー), 松林 優一郎 (東北大/理研) - Q6-9 日本語によるコード生成能力の正確な評価に向けて
○種口 暁人 (東北大), 藤井 諒, 森下 睦 (フューチャー/東北大), 鈴木 潤 (東北大/理研/NII) - Q6-14 大規模視覚言語モデルの質感知覚能力の分析
○松田 陵佑, 塩野 大輝 (東北大), Ana Brassard (理研/東北大), 鈴木 潤 (東北大/理研/NII) - Q6-19 Towards Formalizing Socratic Questions for Explainable Socratic Question Generation
○Surawat Pothong (Japan Advanced Institute of Science and Technology), Paul Reisert (Beyond Reason), Naoya Inoue (Japan Advanced Institute of Science and Technology), Machi Shimmei, Wenzhi Wang, Shoichi Naito (東北大), Jungmin Choi (理研), Kentaro Inui (Mohamed bin Zayed University of Artificial Intelligence) - Q6-24 時事情報に関する日本語QAベンチマーク『ニュースQ』
○植木 快, 川畑 輝, 田口 雄哉, 新妻 巧朗, 浦川 通, 田森 秀明 (朝日新聞社), 岡崎 直観 (科学大), 乾 健太郎 (MBZUAI/東北大/理研)
A7:NLPモデルの解釈可能性・分析(3) 3月12日(水) 13:00-14:30 A会場
- A7-5 LM は日本の時系列構造をどうエンコードするか
○佐々木 睦史, 鴨田 豪, 高橋 良允 (東北大), Benjamin Heinzerling (理研/東北大), 坂口 慶祐 (理研)
C7:音声言語処理 3月12日(水) 13:00-14:30 C会場
- C7-1 SOMO: 音声認識出力の可読性向上を目的とした整文手法の提案
○杉野 かおり, 山野 陽祐, 河崎 真琴, 田森 秀明 (朝日新聞社), 岡崎 直観 (科学大), 乾 健太郎 (MBZUAI/東北大/理研)
P7:ポスター 3月12日(水) 13:00-14:30 ポスター2F
- P7-20 大規模言語モデルが持つ抽象推論能力の分析
○清野 輝風 (東北大), 青木 洋一, 斉藤 いつみ, 坂口 慶祐 (東北大/理研) - P7-25 ダイアグラム理解に向けた大規模視覚言語モデルの内部表現の分析
○吉田 遥音, 工藤 慧音, 青木 洋一 (東北大), 田中 涼太 (東北大/NTT), 斉藤 いつみ, 坂口 慶祐, 乾 健太郎 (東北大)
Q7:ポスター 3月12日(水) 13:00-14:30 ポスター1F
- Q7-23J クイズコンペティションの結果分析から見た日本語質問応答の到達点と課題
○有山 知希 (東北大), 鈴木 潤 (東北大/理研), 鈴木 正敏 (Studio Ousia), 田中 涼太 (NTT/東北大), 赤間 怜奈 (東北大/理研), 西田 京介 (NTT)
3/13(木)
A8:NLPモデルの解釈可能性・分析(4) 3月13日(木) 8:30-10:00 A会場
- A8-1 似た単語の知識ニューロンは似た形成過程を経る
○有山 知希 (東北大/理研), Benjamin Heinzerling (理研/東北大), 穀田 一真 (東北大/理研), 乾 健太郎 (MBZUAI/東北大/理研)
B8:言語資源構築 3月13日(木) 8:30-10:00 B会場
- B8-6 Sketch2Diagram: 視覚的指示を入力とするダイアグラム生成
○斉藤 いつみ (東北大/理研), 吉田 遥音 (東北大), 坂口 慶祐 (東北大/理研)
C8:NLPのための効率的/低リソース手法 3月13日(木) 8:30-10:00 C会場
- C8-4 モデル拡張を用いた段階的事前学習によるモデル系列の効率的な構築
○矢野 一樹 (東北大), 高瀬 翔 (東北大/SB Intuitions), 小林 颯介 (東北大), 清野 舜 (SB Intuitions), 鈴木 潤 (東北大)
D8:対話(1) 3月13日(木) 8:30-10:00 D会場
- D8-4 大規模言語モデルを用いた対話品質評価に関する調査
○赤間 怜奈, 鈴木 潤 (東北大/理研)
P8:ポスター 3月13日(木) 8:30-10:00 ポスター2F
- P8-20 SoftMatcha: 大規模コーパス検索のための柔らかくも高速なパターンマッチャー
○出口 祥之 (NAIST), 鴨田 豪 (東北大), 松下 祐介 (京大), 田口 智大 (ノートルダム大), 末永 幸平, 和賀 正樹 (京大), 横井 祥 (国語研/東北大/理研)
Q8:ポスター 3月13日(木) 8:30-10:00 ポスター1F
- Q8-3 継続事前学習によるLLMの知識獲得
○高橋 洸丞, 近江 崇宏, 有馬 幸介 (ストックマーク), Benjamin Heinzerling (理研/東北大), Qin Dai (東北大), 乾 健太郎 (東北大/理化学研究所(RIKEN) - Q8-5 日本語バイト符号化マスク言語モデルの開発と分析
○工藤 慧音 (東北大/理研), 鴨田 豪, 塩野 大輝 (東北大), 鈴木 潤 (東北大/理研/NII) - Q8-9 モデルマージを用いたLLM翻訳における破滅的忘却の抑制
○岩川 光一, Zhu Haocheng, 鈴木 潤 (東北大), 永田 昌明 (NTT)
C9:情報検索・テキストマイニング 3月13日(木) 10:20-11:50 C会場
- C9-4 VDocRAG: 視覚的文書に対する検索拡張生成
○田中 涼太 (NTT/東北大), 壹岐 太一, 長谷川 拓, 西田 京介, 齋藤 邦子 (NTT), 鈴木 潤 (東北大)
D9:対話(2) 3月13日(木) 10:20-11:50 D会場
- D9-4 MQM-Chat: 対話翻訳のための多次元品質指標
○Yunmeng Li (東北大), 鈴木 潤 (東北大/理研), 森下 睦 (フューチャー/東北大), 阿部 香央莉 (MLS/東北大/理研), 乾 健太郎 (MBZUAI/東北大/理研)
P9:ポスター 3月13日(木) 10:20-11:50 ポスター2F
- P9-4 Investigating Implicit Reasoning in Counter-Argument Logical Structure Analysis
○Wenzhi Wang (東北大/理研), Paul Reisert (Beyond Reason), 内藤 昭一 (東北大/理研/リコー), 井之上 直也 (JAIST/理研), 震明 万智 (東北大), Surawat Pothong (JAIST), Jungmin Choi (理研), 乾 健太郎 (東北大/理研) - P9-10 発話スタイルの類似とユーザ本人による対話の好ましさの相関
○沼屋 征海, 守屋 彰二 (東北大), 佐藤 志貴 (東北大/サイバーエージェント), 赤間 怜奈, 鈴木 潤 (東北大/理研) - P9-18 バックトラッキングを活用したマルチエージェントシステムによる複数制約充足プランニング
○守屋 彰二 (東北大), 大萩 雅也 (SB Intuitions)
A10:機械翻訳(2) 3月13日(木) 13:00-14:30 A会場
- A10-3 Towards Equitable Translation: Gender Bias in Large Language Models
○Hong Hai Ngo, Yunmeng Li (東北大), 坂口 慶祐 (東北大/理研)
B10:形態素・構文・意味解析 3月13日(木) 13:00-14:30 B会場
- B10-1 不均衡最適輸送を用いた意味変化検出
○岸野 稜, 山際 宏明 (京大), 永田 亮 (甲南大/理研), 横井 祥 (国語研/東北大/理研), 下平 英寿 (京大/理研) - B10-4 JDD-PAS:規範的な日本語日常対話コーパスへの意味役割ラベル・述語項構造付与
○吉野 幸一郎 (東京科学大/理研/NAIST), Lee Sangmyeong (NAIST/理研), 波部 英子 (理研), 大村 舞, 浅原 正幸 (国語研), 若狭 絢 (東北大), 赤間 怜奈, 鈴木 潤 (東北大/理研)
E10:テーマセッション3: 認知・脳と自然言語処理(3) 3月13日(木) 13:00-14:30 E会場
- E10-3 大規模言語モデルの浅い層が人間の速い言語処理を再現する
○栗林 樹生 (MBZUAI), 大関 洋平 (東大), Souhaib Ben Taieb (MBZUAI), 乾 健太郎 (MBZUAI/東北大/理研), Timothy Baldwin (MBZUAI/メルボルン大)
P10:ポスター 3月13日(木) 13:00-14:30 ポスター2F
- P10-11 対話評価における参照応答集合の妥当性と言語モデルが出力する応答の多様性の関係
○佐藤 魁 (東北大), 吉野 幸一郎 (科学大/理研/NAIST), 赤間 怜奈, 鈴木 潤 (東北大/理研)