Learning Fundamentals of NLP【自然言語処理基礎勉強会】
概要
- B4, M1の学生を中心に,自然言語処理の基礎を学ぶため,自然言語処理に関する本の輪講をおこなっています.
目的
- 自然言語処理の基礎を学ぶ
- 自然言語処理関係の英文を読む訓練を行う
教科書
- 第1部
- 黒橋『自然言語処理』, 放送大学教育振興会, 2023
- 第2部
- 岡﨑 直観 著、荒瀬 由紀 著、鈴木 潤 著、鶴岡 慶雅 著、宮尾 祐介「自然言語処理の基礎」, オーム社, 2022
- 第3部
- SLP (3rd): Daniel Jurafsky & James H. Martin, “Speech and Language Processing”, 3rd Edition (draft), 2023/1版を想定.
- SLP (2nd ed.): Daniel Jurafsky & James H. Martin, “Speech and Language Processing”, 2nd Edition, 2009.
- Yoav: Yoav Goldberg, “Neural Network Methods for Natural Language Processing”, 2017
- CS224n: Chris Manning (Stanford), CS224n, Natural Language Processing with Deep Learning.
- Web with lecture notes, slides, videos, suggested readings
- CS11-747: Graham Neubig (CMU), CS 11-747, Neural Networks for NLP.
- Embedding book: Mohammad Taher Pilehvar & Jose Camacho-Collados, “Embeddings in Natural Language Processing”, draft, 2020.
References
- 書籍など
- 黒橋『自然言語処理』2015, 奥村『自然言語処理の基礎』2010
- 坪井裕太, 海野裕也, 鈴木潤『深層学習による自然言語処理』, 2017
- 人工知能学会『人工知能学大辞典』, 2017
- Robert A Wilson, Frank C. Keil, 中島秀之監訳『MIT認知科学大辞典』, 2012
- 講義資料など
- Web用語集など
Chapter 11: Machine Translation
- Recurrent Neural Networks
- PFN Tokuiさんの資料
- RNNの雰囲気はこれで掴む
- CS224n Lecture 09 Neural Machine Translation
- NMTの導入に
- 図が多くてわかりやすい
- 特にビームサーチの図が非常に良い
- ニューラルネットに基づく機械翻訳
- Graham先生のチュートリアル
- NMTが登場したばかりの時期の空気感がわかる
- Neural Machine Translation and Sequence-to-sequence Models: A Tutorial
- Graham先生のチュートリアル(英語)
- NMTを体系的に学びたい人に
- 深層学習による自然言語処理 3章 4章
- 日本語の資料が良い場合はこれを
進め方
- 1章当たり2,3回かけて担当の人が内容を説明します.SLPについては全訳を作る必要はないですが,英語力に自信のない人は主要な文(パラグラフ)だけでも作りましょう.
- アジェンダ(レジュメ)を配布すると聞いている人の助けになります.
- 最低限キーワードの説明ができるくらいが目標です.キーワードの説明ができなければ他の参考書を当たるなり検索するなりして調べましょう.どの参考書を見ればいいのか分からなければ担当の TA の人に相談してください.
- 第3部を進める際, SLP 3rd Edition.draftの未執筆章については2nd Editionや他の書籍・資料を適宜参照します
スライドを作る上で注意
- アスペクト比は16:9
- ページ番号を振りましょう
- 参考にした書籍やwebページは書籍名・URLを参考資料としてスライドに記載しましょう
2024年度
- 参加者
- TBA
日程・読む章・TA・担当
第1部 (3-4月)
Tohoku NLP Group配属のB3で先取り.
日時 | Chapter | 内容 | 担当 | 資料 | TA |
---|---|---|---|---|---|
2024/03/04 | 第1章 | 自然言語処理の概要と歴史 | 久保田 | 内部資料 | 羽根田 |
2024/03/08 | 第2章 | 文字列・テキスト処理の基礎 | 種口 | 内部資料 | 中野 |
2024/03/18 | 第3章 | 言語リソースの構築(1) | 佐藤(kosuke) | 内部資料 | 佐藤(kai) |
2024/03/22 | 第4章 | 言語リソースの構築(2) | 清野 | 内部資料 | 原 |
2024/03/25 | 第5章 | 語の意味の扱い | 渡邉 | 内部資料 | 松崎 |
2024/03/29 | 第6章 | ニューラル自然言語処理の基礎 | 池田 | 吉田 | |
2024/04/ | 第7章 | 機械翻訳 | 沼屋 | 亀井 | |
2024/04/ | 第8章 | Attention機構に基づくニューラルネットワークモデル | 小林(haruto) | 木村 | |
2024/04/ | 第9章 | 系列の解析 | 柴田 | 穀田 | |
2024/04/ | 第10章 | 構文の解析 | 久保田 | 塩野 | |
2024/04/ | 第11章 | 文の意味の解析 | 種口 | 坂田 | |
2024/04/ | 第12章 | 文脈の解析 | 佐藤(kosuke) | 葉 | |
2024/04/ | 第13章 | 情報検索 | 清野 | 栗田 | |
2024/04/ | 第14章 | 質問応答 | 渡邉 | 鴨田 | |
2024/05/ | 第15章 | 対話システム | 池田 | 守屋 |
第2部 (4-6月)
新M1のメンバーが合流.最先端にキャッチアップ.
日時 | Chapter | 内容 | 担当 | 資料 | TA |
---|---|---|---|---|---|
第1章 | 自然言語処理の概要 | ||||
第2章 | 自然言語処理のための機械学習の基礎 | ||||
第3章 | 単語ベクトル表現 | ||||
第4章 | 系列に対するニューラルネットワーク | ||||
第5章 | 言語モデル・系列変換モデル | ||||
第6章 | Transformer | ||||
第7章 | 事前学習モデルと転移学習 | ||||
第8章 | 系列ラベリング | ||||
第9章 | 構文解析 | ||||
第10章 | 意味解析 | ||||
第11章 | 応用タスク・まとめ |
第3部 (7-12月)
各トピックについて深堀り.第1・2部で扱った内容については英語で復習.
日時 | Book/Course | Chapter | 内容 | 担当 | 資料 | TA |
---|---|---|---|---|---|---|
SLP (3rd ed.) | Chapter 1 | Introduction | ||||
Yoav | Chapter 1–1.3 | Introduction | ||||
SLP | Chapter 3 | Language Modeling with N-Grams | ||||
SLP | Chapter 4 | Naive Bayes and Sentiment Classification | ||||
SLP | Chapter 5 | Logistic Regression | ||||
SLP | Chapter 6 | Vector Semantics and Embeddings | ||||
SLP | Chapter 7 | Neural Networks and Neural Language Models | ||||
SLP | Chapter 8 | Sequence Labeling for Parts of Speech and Named Entities | ||||
SLP | Chapter 9 | RNNs and LSTMs | ||||
SLP | Chapter 10 | Transformers and Pretrained Language Models | ||||
SLP | Chapter 11 | Fine-tuning and Masked Language Models | ||||
Embedding book | Chapter 6 | Contextualized Embeddings | ||||
以降,余裕があれば | ||||||
SLP | Chapter 13 | Machine Translation | ||||
SLP | Chapter 14 | Question Answering and Information Retrieval | ||||
SLP | Chapter 15 | Chatbots and Dialogue Systems | ||||
SLP | Chapter 23 | Word Senses and WordNet | ||||
SLP | Chapter 26 | Coreference Resolution | ||||
SLP | Chapter 27 | Discourse Coherence | ||||
SLP | Chapter 28 | Phonetics |
過去の記録
- 2023年度
- 2022年度
- 2021年度
- 2020年度
- 2019年度
- 2018年度
- 2017年度
- 2016年度, 2nd Track
- 2015年度
- 2014年度
- 2013年度
- 2012年度
- 2011年度
- 2010年度
Last-modified: 2024-03-24 (Sun) 03:21:49 (5d)