ジャーナル論文

藤田剛，澤田悠冶，坂井優介，渡辺太郎. 2026. 法令文における法令間委任関係の自動抽出. 自然言語処理 (採録決定).
Huayang Li, Yahui Liu, Hongyu Sun, Deng Cai, Leyang Cui, Wei Bi, Peilin Zhao and Taro Watanabe. 2026. SeqPE: Transformer with Sequential Position Encoding. Transactions on Pattern Analysis and Machine Intelligence (to appear).
Xuan Zhou, Xuefeng Wei, Zhi Qu, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2026. A Cross-Domain Tool-Augmented Vision–Language Framework for Remote Sensing Image Understanding. Remote Sensing.
芳賀あかり，菅原朔，深津聡世，大羽未悠，大内啓樹，渡辺太郎，大関洋平. 2026. 小規模言語モデルによる子どものU字型学習曲線のモデリング. 自然言語処理 (採録決定).
夏見昂樹，出口祥之，坂井優介，上垣外英剛，渡辺太郎. 2026. 合意制約を用いた効率的な確率的最小ベイズリスク復号. 自然言語処理.
長谷川遼，坂井優介，上垣外英剛，渡辺太郎. 2026. 知識編集による言語モデルの確信度への影響. 自然言語処理.
尾崎慎太郎，林和樹，坂井優介，上垣外英剛，林克彦，渡辺太郎. 2026. 大規模視覚言語モデルにおける芸術作品の多言語説明生成能力の評価. 自然言語処理.
Zhi Qu, Yiran Wang, Jiannan Mao, Jin Tei, Hideki Tanaka, Masao Utiyama and Taro Watanabe. 2026. MITRE: Efficient Pre-trained Models for Multilingual Neural Machine Translation with Registering. 自然言語処理.
Mana Makinae, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2026. Rethinking Evaluation in Simultaneous Speech Translation: A Case for Monotonic Test Sets. Computational Linguistics (to appear).
Takumi Goto, Yusuke Sakai and Taro Watanabe. 2026. Grammatical Error Correction Evaluation by Optimally Transporting Edit Representation. Transactions of the Association for Computational Linguistics (to appear).
Yusuke Sakai, Zhi Qu, Hidetaka Kamigaito, Taro Watanabe and Xiaojiang Liu. 2026. Domain Translation with Monolingual Lexical Distribution. Transactions on Machine Learning Research.
Yuki Yamamoto, Taro Watanabe and Yuji Matsumoto. 2026. Syntactic Disambiguation of Complex Sentences via Forest Reranking. 自然言語処理.
五藤巧，Justin Vasselli，渡辺太郎. 2026. 文法誤り訂正における編集レベル帰属に基づく文レベル尺度の説明性向上. 自然言語処理.
大羽未悠，大関洋平，深津聡世，芳賀あかり，大内啓樹，渡辺太郎，菅原朔. 2026. 言語モデルの間接証拠からの文法知識の獲得. 自然言語処理.
井手佑翼，西田悠人，Justin Vasselli，大羽未悠，坂井優介，上垣外英剛，渡辺太郎. 2026. 大規模言語モデルの文法知識評価方法の再検討. 自然言語処理.
Xincan Feng, Hejie Cui, Kazuki Hayashi, Huy Hien Vu, Kenta T. Suzuki, Noriki Nishida, Hidetaka Kamigaito, Yuji Matsumoto, Taro Watanabe and Carl Yang. 2025. LLMKG＋: Systematically improving knowledge quality and coverage in KGs using LLMs – A case study in medical domain. AI Open.
西田悠人，森下睦，出口祥之，上垣外英剛，渡辺太郎. 2025. kNN言語モデルの低頻度語に対する振る舞いの分析. 自然言語処理.
Adam Nohejl, Akio Hayakawa, Yusuke Ide and Taro Watanabe. 2025. A Japanese Dataset and Efficient Multilingual LLM-Based Methods for Lexical Simplification and Lexical Complexity Prediction. 自然言語処理.
片山歩希，東山翔平，大内啓樹，坂井優介，竹内綾乃，坂東諒，橋本雄太，小木曽智信，渡辺太郎. 2025. 場所参照表現抽出における言語モデルの時代横断型評価. 自然言語処理.
橋本航，上垣外英剛，渡辺太郎. 2025. データ拡張による固有表現抽出の不確実性推定. 自然言語処理.
Haruki Sakajo, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. Vowel Articulation and Tongue Position in Language Models. 自然言語処理.
Huayang Li, Deng Cai, Zhi Qu, Qu Cui, Hidetaka Kamigaito, Lemao Liu and Taro Watanabe. 2025. Cross-lingual Contextualized Phrase Retrieval. 自然言語処理.
出内将夫，笈田佳彰，東山翔平，田中英輝，内山将夫，渡辺太郎. 2025. LLMを用いたリランキングによるERPソフトウェア部品推薦システム. 自然言語処理.
Kosuke Doi, Katsuhito Sudoh, Satoshi Nakamura and Taro Watanabe. 2025. Enhancing Automated Essay Scoring with Grammatical Features using Multi-task Learning and Item Response Theory. 自然言語処理.
Tatsuya Aoki, Jey Han Lau, Hidetaka Kamigaito, Hiroya Takamura, Timothy Baldwin and Manabu Okumura. 2025. Discovering Unusual Word Usages with Masked Language Model via Pseudo-label Training. 自然言語処理.
Zhiyu Guo, Hidetaka Kamigaito and Taro Watanabe. 2025. Dependency-Aware Semi-Structured Sparsity of GLU Variants in Large Language Models. Transactions on Machine Learning Research.
坂井優介，上垣外英剛，林克彦，渡辺太郎. 2024. 未知の知識に対する事前学習済み言語モデルが持つ推論能力の調査. 自然言語処理. 論文賞
澤田悠冶，安井雄一郎，大内啓樹，渡辺太郎，石井昌之，石原祥太郎，山田剛，進藤裕之. 2024. 日経企業IDリンキングのための類似度ベースELシステムの構築と分析. 自然言語処理.
Kosuke Doi, Katsuhito Sudoh and Satoshi Nakamura. 2024. NAIST Simultaneous Interpretation Corpus: Development and Analyses of Data from Interpreters of Different Levels. 自然言語処理.
Huy Hien Vu, Hidetaka Kamigaito and Taro Watanabe. 2024. Context-Aware Machine Translation with Source Coreference Explanation. Transactions of the Association for Computational Linguistics.
大羽未悠，栗林樹生，大内啓樹，渡辺太郎. 2024. 言語モデルの第二言語獲得. 自然言語処理. 論文賞
Hiroyuki Deguchi, Taro Watanabe, Yusuke Matsui, Masao Utiyama, Hideki Tanaka and Eiichiro Sumita. 2024. Subset Retrieval Nearest Neighbor Machine Translation. 自然言語処理.
Jungmin Choi, Ukyo Honda, Taro Watanabe and Kentaro Inui. 2023. Explainable Natural Language Inference in the Legal Domain via Text Generation. 人工知能学会論文誌.
Van-Hien Tran, Hiroki Ouchi, Hiroyuki Shindo, Yuji Matsumoto and Taro Watanabe. 2023. Enhancing Semantic Correlation between Instances and Relations for Zero-Shot Relation Extraction. 自然言語処理.
Shintaro Harada and Taro Watanabe. 2022. Neural Machine Translation with Synchronous Latent Phrase Structure. 自然言語処理.
Yuki Yamamoto, Yuji Matsumoto and Taro Watanabe. 2022. Dependency Patterns of Complex Sentences and Semantic Disambiguation for Abstract Meaning Representation Parsing. 自然言語処理.
本多右京, 橋本敦史, 渡辺太郎, 松本裕治. 2022. 擬似教師ありキャプション生成における部分的不一致の除去. 人工知能学会論文誌.
Yiran Wang, Hiroyuki Shindo, Yuji Matsumoto, and Taro Watanabe. 2022. Nested Named Entity Recognition via Explicitly Excluding the Influence of the Best Path. 自然言語処理.
Hiroki Ouchi, Jun Suzuki, Sosuke Kobayashi, Sho Yokoi, Tatsuki Kuribayashi, Masashi Yoshikawa and Kentaro Inui. 2021. Instance-Based Neural Dependency Parsing. Transactions of the Association for Computational Linguistics.
Farjana Sultana Mim, Naoya Inoue, Paul Reisert, Hiroki Ouchi and Kentaro Inui. 2021. Corruption Is Not All Bad: Incorporating Discourse Structure Into Pre-Training via Corruption for Essay Scoring. IEEE/ACM Transactions on Audio, Speech, and Language Processing.
澤田悠冶, 寺西裕紀, 松本裕治, 渡辺太郎. 2021. 複合化された固有表現認識のための教師なし並列構造解析. 自然言語処理.
Van-Hien Tran, Van-Thuy Phi, Akihiko Kato, Hiroyuki Shindo, Taro Watanabe and Yuji Matsumoto. 2021. Improved Decomposition Strategy for Joint Entity and Relation Extraction. 自然言語処理.
Masao Ideuchi, Yohei Sakamoto, Yoshitaka Oida, Isaac Okada, Shohei Higashiyama, Masao Utiyama, Eiichiro Sumita and Taro Watanabe. 2021. A Selection Support System for Enterprise Resource Planning Package Components using Ensembles of Multiple Models with Round-trip Translation. 自然言語処理.
出口祥之, 内山将夫, 田村晃裕, 二宮崇, 隅田英一郎. 2021. ニューラル機械翻訳のためのバイリンガルなサブワード分割. 自然言語処理.
寺西裕紀, 進藤裕之, 渡辺太郎, 松本裕治. 2020. 局所的モデルとCKYアルゴリズムによる並列構造解析. 自然言語処理.
Shohei Higashiyama, Masao Utiyama, Yuji Matsumoto, Taro Watanabe and Eiichiro Sumita. 2020. Auxiliary Lexicon Word Prediction for Cross-Domain Word Segmentation. 自然言語処理.
Shohei Higashiyama, Masao Utiyama, Eiichiro Sumita, Masao Ideuchi, Yoshiaki Oida, Yohei Sakamoto, Isaac Okada and Yuji Matsumoto. 2020. Character-to-Word Attention for Word Segmentation. 自然言語処理. 論文賞

国際会議

Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2026. Noisy-Channel Minimum Bayes Risk Decoding. ICML 2026 (to appear).
Huayang Li, Tianyu Zhao, Deng Cai and Richard Sproat. 2026. RePo: Language Models with Context Re-Positioning. ICML 2026 (to appear).
Miyu Oba and Saku Sugawara. 2026. CxMP: A Linguistic Minimal-Pair Benchmark for Evaluating Constructional Understanding in Language Models. ACL 2026.
Yuto Nishida, Naoki Shikoda, Yosuke Kishinami, Ryo Fujii, Makoto Morishita, Hidetaka Kamigaito and Taro Watanabe. 2026. Revisiting Non-Verbatim Memorization in Large Language Models: The Role of Entity Surface Forms. ACL 2026.
Hiroyuki Deguchi, Katsuki Chousa and Yusuke Sakai. 2026. One Single Hub Text Breaks CLIP: Identifying Vulnerabilities in Cross-Modal Encoders via Hubness. ACL 2026.
Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2026. HalluCitation Matters: Revealing the Impact of Hallucinated References with 300 Hallucinated Papers in ACL Conferences. ACL 2026.
Jesse Atuhurra, Iqra Ali, Tomoya Iwakura, Hidetaka Kamigaito and Tatsuya Hiraoka. 2026. VLURes: Benchmarking Long-Text Grounding and Cross-Lingual Robustness in Vision Language Models. ACL 2026 Findings.
Sungwoo Han, Sangjun Moon, Jingun Kwon, Hidetaka Kamigaito and Manabu Okumura. 2026. Measuring Watermarking under Jailbreaking: ASR Inflation and Goal-Compliance Mismatch. ACL 2026 Findings.
Jingxuan Liu, Zhi Qu, Jin Tei, Hidetaka Kamigaito, Lemao Liu and Taro Watanabe. 2026. XQ-MEval: A Dataset with Cross-lingual Parallel Quality for Benchmarking Translation Metrics. ACL 2026 Findings.
Riza Setiawan Soetedjo, Yusuke Sakai, Hidetaka Kamigaito, Jingun Kwon, Manabu Okumura and Taro Watanabe. 2026. Enhancing Factuality through Consensus and Consistency in Summarization Using Minimum Bayes Risk Decoding. ACL 2026 Findings.
Eunike Andriani Kardinata, Yusuke Sakai and Taro Watanabe. 2026. Assessing the Effect of Context in Multi-domain Acceptability Judgment. ACL 2026 Findings.
Kosuke Doi, Mana Makinae, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2026. Simul-COMET: A Quality Metric for Simultaneous Interpretation in Distant Language Pair Considering Word Order Difference. ACL 2026 Findings.
Justin Vasselli, Adam Nohejl and Taro Watanabe. 2026. An AI-Assisted Co-planning System for Early English Reading Practice. Artificial Intelligence in Education (AIED 2026).
Kazuki Hayashi, Shintaro Ozaki, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2026. Diagnosing Vision Language Models’ Perception by Leveraging Human Methods for Color Vision Deficiencies. EACL 2026.
Xuefeng Wei, Xuan Zhou, Yusuke Sakai and Taro Watanabe. 2026. `Yuki Gets Sushi, David Gets Steak?’’: Uncovering Gender and Racial Biases in LLM-Based Meal Recommendations. EACL 2026.
Tomoyuki Jinno, Kazuki Hayashi, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2026. Cosine Similarity as Logits?: A Scalable Knowledge Probe Using Embedding Vectors from Generative Language Models. EACL 2026.
Ye Xiong, Hidetaka Kamigaito, Soichiro Murakami, Peinan Zhang, Hiroya Takamura and Manabu Okumura. 2026. Progressive Visual Refinement for Multi-modal Summarization. EACL 2026.
Hiroyuki Deguchi, Katsuki Chousa, Yusuke Sakai. 2026. Hacking Neural Evaluation Metrics with a Single Text. EACL 2026.
Justin Vasselli, Arturo MP, Frederikus Hudi, Haruki Sakajo and Taro Watanabe. 2026. Measuring Linguistic Competence of LLMs on Indigenous Languages of the Americas. EACL 2026.
Zhe Cao, Yusuke Oda, Qianying Liu, Akiko Aizawa and Taro Watanabe. 2026. Completely Modular Fine-tuning for Dynamic Language Adaptation. EACL 2026 Findings.
Juseon Do, Sungwoo Han, Jingun Kwon, Hidetaka Kamigaito and Manabu Okumura. 2026. ConRAS: Contrastive In-context Learning Framework for Retrieval-Augmented Summarization. EACL 2026 Findings.
Juseon Do, Sungwoo Han, Jingun Kwon, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2026. Beyond Sampling: Self-Sorting for Long-Context Ranking. EACL 2026 Findings.
Tsuyoshi Fujita, Yuya Sawada, Yusuke Sakai and Taro Watanabe. 2026. Toward Automatic Delegation Extraction in Japanese Law. EACL 2026 Industry.
Yuya Sawada, Tsuyoshi Fujita, Yusuke Sakai and Taro Watanabe. 2026. entity-linkings: A Unified Library for Entity Linking. EACL 2026 System Demonstrations.
Koki Natsumi, Hiroyuki Deguchi, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. Agreement-Constrained Probabilistic Minimum Bayes Risk Decoding. IJCNLP-AACL 2025.
Mana Makinae, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. Investigating Omission as a Latency Reduction Strategy in Simultaneous Speech Translation. IJCNLP-AACL 2025 Findings.
Jesse Atuhurra, Hidetaka Kamigaito, Taro Watanabe and Koichiro Yoshino. 2025. J-ORA: A Multimodal Framework and Dataset for Japanese Object Identification, Reference, Action Prediction in Robot Perception. 2025 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS).
Ryo Hasegawa, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. Knowledge Editing Induces Underconfidence in Language Models. *SEM 2025.
Chihiro Taguchi, Seng Mai, Keita Kurabe, Yusuke Sakai, Georgina Agyei, Soudabeh Eslami and David Chiang. 2025. Languages Still Left Behind: Toward a Better Multilingual Machine Translation Benchmark. EMNLP 2025.
Justin Vasselli, Eunike Andriani Kardinata, Yusuke Sakai and Taro Watanabe. 2025. Multilingual Dialogue Generation and Localization with Dialogue Act Scripting. EMNLP 2025.
Ashmari Pramodya, Nirasha Nelki, Heshan Shalinda, Chamila Liyanage, Yusuke Sakai, Randil Pushpananda, Ruvan Weerasinghe, Hidetaka Kamigaito and Taro Watanabe. 2025. SinhalaMMLU: A Comprehensive Benchmark for Evaluating Multitask Language Understanding in Sinhala. EMNLP 2025.
Hongyu Sun, Yusuke Sakai, Haruki Sakajo, Shintaro Ozaki, Kazuki Hayashi, Hidetaka Kamigaito and Taro Watanabe. 2025. LoCt-Instruct: An Automatic Pipeline for Constructing Datasets of Logical Continuous Instructions. EMNLP 2025.
Wataru Hashimoto, Hidetaka Kamigaito and Taro Watanabe. 2025. Decoding Uncertainty: The Impact of Decoding Strategies for Uncertainty Estimation in Large Language Models. EMNLP 2025 Findings.
Sangjun Moon, Dasom choi, Jingun Kwon, Hidetaka Kamigaito, Manabu Okumura. 2025. Length Representations in Large Language Models. EMNLP 2025 Findings.
Hiroto Otake, Peinan Zhang, Yusuke Sakai, Masato Mita, Hiroki Ouchi and Taro Watanabe. 2025. BannerBench: Benchmarking Vision Language Models for Multi-Ad Selection with Human Preferences. EMNLP 2025 Findings.
Takumi Goto, Yusuke Sakai and Taro Watanabe. 2025. Reliability Crisis of Reference-free Metrics for Grammatical Error Correction. EMNLP 2025 Findings.
Yuya Sawada, Hiroki Ouchi, Yuichiro Yasui, Hiroki Teranishi, Yuji Matsumoto, Taro Watanabe and Masayuki Ishii. 2025. JaCorpTrack: Corporate History Event Extraction for Tracking Organizational Changes. EMNLP 2025 Industry.
Kazuki Hayashi, Hidetaka Kamigaito, Shinya Kouda and Taro Watanabe. 2025. IterKey: Iterative Keyword Generation with LLMs for Enhanced Retrieval Augmented Generation. Conference on Language Modeling (COLM 2025).
Boxuan Lyu, Hidetaka Kamigaito, Kotaro Funakoshi and Manabu Okumura. 2025. Unveiling the Power of Source: Source-based Minimum Bayes Risk Decoding for Neural Machine Translation. ACL 2025.
Aitaro Yamamoto, Hiroyuki Otomo, Hiroki Ouchi, Shohei Higashiyama, Hiroki Teranishi, Hiroyuki Shindo and Taro Watanabe. 2025. Graph-Structured Trajectory Extraction from Travelogues. ACL 2025.
Zhi Qu, Yiran Wang, Jiannan Mao, Chenchen Ding, Hideki Tanaka, Masao Utiyama and Taro Watanabe. 2025. Registering Source Tokens to Target Language Spaces in Multilingual Neural Machine Translation. ACL 2025.
Yusuke Ide, Joshua Tanner, Adam Nohejl, Jacob Hoffman, Justin Vasselli, Hidetaka Kamigaito and Taro Watanabe. 2025. CoAM: Corpus of All-Type Multiword Expressions. ACL 2025.
Hidetaka Kamigaito, Hiroyuki Deguchi, Yusuke Sakai, Katsuhiko Hayashi and Taro Watanabe. 2025. Diversity Explains Inference Scaling Laws: Through a Case Study of Minimum Bayes Risk Decoding. ACL 2025.
Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. Revisiting Compositional Generalization Capability of Large Language Models Considering Instruction Following Ability. ACL 2025. Outstanding Paper Award
Shintaro Ozaki, Kazuki Hayashi, Miyu Oba, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. BQA: Body Language Question Answering Dataset for Video Large Language Models. ACL 2025.
Takumi Goto, Yusuke Sakai and Taro Watanabe. 2025. Rethinking Evaluation Metrics for Grammatical Error Correction: Why Use a Different Evaluation Process than Human?. ACL 2025.
Soichiro Murakami, Peinan Zhang, Hidetaka Kamigaito, Hiroya Takamura and Manabu Okumura. 2025. AdParaphrase v2.0: Generating Attractive Ad Texts Using a Preference-Annotated Paraphrase Dataset. ACL 2025 Findings.
Yusuke Sakai, Takumi Goto and Taro Watanabe. 2025. IMPARA-GED: Grammatical Error Detection is Boosting Reference-free Grammatical Error Quality Estimator. ACL 2025 Findings.
Haruki Sakajo, Yusuke Ide, Justin Vasselli, Yusuke Sakai, Yingtao Tian, Hidetaka Kamigaito and Taro Watanabe. 2025. Dictionaries to the Rescue: Cross-Lingual Vocabulary Transfer for Low-Resource Languages Using Bilingual Dictionaries. ACL 2025 Findings.
Takumi Goto, Yusuke Sakai, and Taro Watanabe. 2025. gec-metrics: A Unified Library for Grammatical Error Correction Evaluation. ACL 2025 System Demonstrations.
Zhi Qu, Chenchen Ding and Taro Watanabe. 2025. Languages Transferred Within the Encoder: On Representation Transfer in Zero-Shot Multilingual Translation. MT Summit 2025. Best Paper Award
Genta Indra Winata, Frederikus Hudi, Patrick Amadeus Irawan, David Anugraha, Rifki Afina Putri, WANG YUTONG, Adam Nohejl, Ubaidillah Ariq Prathama, Nedjma Ousidhoum, Afifa Amriani, Anar Sabuhi Rzayev, Anirban Das, Ashmari Pramodya, Aulia Adila, Bryan Wilie, Candy Olivia Mawalim, CHENG Ching Lam, Daud Abolade, Emmanuele Chersoni, Enrico Santus, Fariz Ikhwantri, Garry Kuwanto, Hanyang Zhao, Haryo Akbarianto Wibowo, Holy Lovenia, Jan Christian Blaise Cruz, Jan Wira Gotama Putra, Junho Myung, Lucky Susanto, Maria Angelica Riera Machin, Marina Zhukova, Michael Anugraha, Muhammad Farid Adilazuarda, Natasha Christabelle Santosa, Peerat Limkonchotiwat, Raj Dabre, Rio Alexander Audino, Samuel Cahyawijaya, Shi-Xiong Zhang, Stephanie Yulia Salim, Yi Zhou, Yinxuan Gui, David Ifeoluwa Adelani, En-Shiun Annie Lee, Shogo Okada, Ayu Purwarianti, Alham Fikri Aji, Taro Watanabe, Derry Tanti Wijaya, Alice Oh and Chong-Wah Ngo. 2025. WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines. NAACL 2025. Best Theme Paper Award
Yusuke Ide, Yuto Nishida, Justin Vasselli, Miyu Oba, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. How to Make the Most of LLMs’ Grammatical Knowledge for Acceptability Judgments. NAACL 2025.
Peinan Zhang, Yusuke Sakai, Masato Mita, Hiroki Ouchi and Taro Watanabe. 2025. AdTEC: A Unified Benchmark for Evaluating Text Quality in Search Engine Advertising. NAACL 2025.
Haruki Sakajo, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. Tonguescape: Exploring Language Models Understanding of Vowel Articulation. NAACL 2025.
Eri Onami, Taiki Miyanishi, Koki Maeda and Shuhei Kurita. 2025. LegalViz: Legal Text Visualization by Text To Diagram Generation. NAACL 2025.
Shintaro Ozaki, Kazuki Hayashi, Yusuke Sakai, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2025. Towards Cross-Lingual Explanation of Artwork in Large-scale Vision Language Models. NAACL 2025 Findings.
Wataru Hashimoto, Hidetaka Kamigaito and Taro Watanabe. 2025. Efficient Nearest Neighbor based Uncertainty Estimation for Natural Language Processing Tasks. NAACL 2025 Findings.
Yuto Nishida, Makoto Morishita, Hiroyuki Deguchi, Hidetaka Kamigaito and Taro Watanabe. 2025. Long-Tail Crisis in Nearest Neighbor Language Models. NAACL 2025 Findings.
Soichiro Murakami, Peinan Zhang, Hidetaka Kamigaito, Hiroya Takamura and Manabu Okumura. 2025. AdParaphrase: Paraphrase Dataset for Analyzing Linguistic Features toward Generating Attractive Ad Texts. NAACL 2025 Findings.
Juseon-Do, Jaesung Hwang, Jingun Kwon, Hidetaka Kamigaito and Manabu Okumura. 2025. Considering Length Diversity in Retrieval-Augmented Summarization. NAACL 2025 Findings.
Hiroyuki Deguchi, Go Kamoda, Yusuke Matsushita, Chihiro Taguchi, Kohei Suenaga, Masaki Waga and Sho Yokoi. 2025. A Soft and Fast Pattern Matcher for Billion-Scale Corpus Searches. ICLR 2025.
Justin Vasselli, Adam Nohejl and Taro Watanabe. 2025. Measuring the Robustness of Reference-Free Dialogue Evaluation Systems. COLING 2025.
Hibiki Nakatani, Hiroki Teranishi, Shohei Higashiyama, Yuya Sawada, Hiroki Ouchi and Taro Watanabe. 2025. A Text Embedding Model with Contrastive Example Mining for Point-of-Interest Geocoding. COLING 2025.
Adam Nohejl, Frederikus Hudi, Eunike Andriani Kardinata, Shintaro Ozaki, Maria Angelica Riera Machin, Hongyu Sun, Justin Vasselli and Taro Watanabe. 2025. Beyond Film Subtitles: Is YouTube the Best Approximation of Spoken Vocabulary?. COLING 2025.
Takumi Goto, Hiroyoshi Nagao and Yuta Koreeda. 2025. Acquiring Bidirectionality via Large and Small Language Models. COLING 2025.
Iqra Ali, Jesse Atuhurra, Hidetaka Kamigaito and Taro Watanabe. 2025. HLU: Human Vs LLM Generated Text Detection Dataset for Urdu at Multiple Granularities. COLING 2025.
Katsuki Chousa and Tsutomu Hirao. 2025. Automatic Evaluation of Language Generation Technology Based on Structure Alignment. COLING 2025.
Kazuki Hayashi, Kazuma Onishi, Toma Suzuki, Yusuke Ide, Seiji Gobara, Shigeki Saito, Yusuke Sakai, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2025. IRR: Image Review Ranking Framework for Evaluating Vision-Language Models. COLING 2025.
Seiji Gobara, Hidetaka Kamigaito and Taro Watanabe. 2024. Do LLMs Implicitly Determine the Suitable Text Difficulty for Users?. PACLIC 38.
Hiroyuki Deguchi, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2024. mbrs: A Library for Minimum Bayes Risk Decoding. EMNLP 2024 System Demonstration.
Wataru Hashimoto, Hidetaka Kamigaito and Taro Watanabe. 2024. Are Data Augmentation Methods in Named Entity Recognition Applicable for Uncertainty Estimation?. EMNLP 2024.
Miyu Oba, Yohei Oseki, Akiyo Fukatsu, Akari Haga, Hiroki Ouchi, Taro Watanabe and Saku Sugawara. 2024. Can Language Models Induce Grammatical Knowledge from Indirect Evidence?. EMNLP 2024.
Zhe Cao, Zhi Qu, Hidetaka Kamigaito and Taro Watanabe. 2024. Exploring Intrinsic Language-specific Subspaces in Fine-tuning Multilingual Neural Machine Translation. EMNLP 2024.
Zhiyu Guo, Hidetaka Kamigaito and Taro Watanabe. 2024. Attention Score is not All You Need for Token Importance Indicator in KV Cache Reduction: Value Also Matters. EMNLP 2024.
Mana Makinae, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2024. Simul-MuST-C: Simultaneous Multilingual Speech Translation Corpus Using Large Language Model. EMNLP 2024.
Yusuke Sakai, Mana Makinae, Hidetaka Kamigaito and Taro Watanabe. 2024. Simultaneous Interpretation Corpus Construction by Large Language Models in Distant Language Pair. EMNLP 2024.
Huayang Li, Deng Cai, Zhi Qu, Qu Cui, Hidetaka Kamigaito, Lemao Liu and Taro Watanabe. 2024. Cross-lingual Contextualized Phrase Retrieval. EMNLP 2024 Findings.
Tsutomu Hirao, Naoki Kobayashi, Hidetaka Kamigaito, Manabu Okumura ande Akisato Kimura. 2024. Video Discourse Parsing and Its Application to Multimodal Summarization: A Dataset and Baseline Approaches. EMNLP 2024 Findings.
Kazuki Hayashi, Yusuke Sakai, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2024. Artwork Explanation in Large-scale Vision Language Models. ACL 2024.
Armin Sarhangzadeh and Taro Watanabe. 2024. Alignment-Based Decoding Policy for Low-Latency and Anticipation-Free Neural Japanese Input Method Editors. ACL 2024 Findings.
Juseon-Do Juseon-Do, Jingun Kwon, Hidetaka Kamigaito and Manabu Okumura. 2024. InstructCMP: Length Control in Sentence Compression through Instruction-based Large Language Models. ACL 2024 Findings.
Huayang Li, Siheng Li, Deng Cai, Longyue Wang, Lemao Liu, Taro Watanabe, Yujiu Yang and Shuming Shi. 2024. TextBind: Multi-turn Interleaved Multimodal Instruction-following in the Wild. ACL 2024 Findings.
Hiroyuki Deguchi, Yusuke Sakai, Hidetaka Kamigaito, Taro Watanabe, Hideki Tanaka and Masao Utiyama. 2024. Centroid-Based Efficient Minimum Bayes Risk Decoding. ACL 2024 Findings.
Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2024. mCSQA: Multilingual Commonsense Reasoning Dataset with Unified Creation Strategy by Language Models and Humans. ACL 2024 Findings.
Akari Haga, Saku Sugawara, Akiyo Fukatsu, Miyu Oba, Hiroki Ouchi, Taro Watanabe and Yohei Oseki. 2024. Modeling Overregularization in Children with Small Language Models. ACL 2024 Findings.
Hiroyuki Deguchi, Masaaki Nagata and Taro Watanabe. 2024. Detector-Corrector: Edit-Based Automatic Post Editing for Human Post Editing. EAMT 2024.
Yusuke Sakai, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2024. Does Pre-trained Language Model Actually Infer Unseen Links in Knowledge Graph Completion?. NAACL 2024.
Benjamin Hsu, Xiaoyu Liu, Huayang Li, Yoshinari Fujinuma, Maria Nadejde, Xing Niu, Ron Litman, Yair Kittenplon and Raghavendra Pappagari. 2024. M3T: A New Benchmark Dataset for Multi-Modal Document-Level Machine Translation. NAACL 2024.
Eunike Kardinata, Hiroki Ouchi and Taro Watanabe. 2024. Constructing Indonesian-English Travelogue Dataset. LREC-COLING 2024.
Frederikus Hudi, Zhi Qu, Hidetaka Kamigaito and Taro Watanabe. 2024. Disentangling Pretrained Representation to Leverage Low-Resource Languages in Multilingual Machine Translation. LREC-COLING 2024.
Iqra Ali, Hidetaka Kamigaito and Taro Watanabe. 2024. Monolingual Paraphrase Detection Corpus for Low Resource Pashto Language at Sentence Level. LREC-COLING 2024.
Eri Onami, Shuhei Kurita, Taiki Miyanishi and Taro Watanabe. 2024. JDocQA: Japanese Document Question Answering Dataset for Generative Language Models. LREC-COLING 2024.
Xincan Feng and Akifumi Yoshimoto. 2024. Llama-VITS: Enhancing TTS Synthesis with Semantic Awareness. LREC-COLING 2024.
Shohei Higashiyama, Hiroki Ouchi, Hiroki Teranishi, Hiroyuki Otomo, Yusuke Ide, Aitaro Yamamoto, Hiroyuki Shindo, Yuki Matsuda, Shoko Wakamiya, Naoya Inoue, Ikuya Yamada and Taro Watanabe. 2024. Arukikata Travelogue Dataset with Geographic Entity Mention, Coreference, and Link Annotation. EACL 2024 Findings.
Hiroyuki Deguchi, Kenji Imamura, Yuto Nishida, Yusuke Sakai, Justin Vasselli and Taro Watanabe. 2023. NAIST-NICT WMT’23 General MT Task Submission. WMT 2023.
Lemao Liu, Francisco Casacuberta, George Foster, Guoping Huang, Philipp Koehn, Geza Kovacs, Shuming Shi, Taro Watanabe and Chengqing Zong. 2023. Findings of the Word-Level AutoCompletion Shared Task in WMT 2023. WMT 2023.
Huayang Li, Tian Lan, Zihao Fu, Deng Cai, Lemao Liu, Nigel Collier, Taro Watanabe and Yixuan Su. 2023. Repetition In Repetition Out: Towards Understanding Neural Text Degeneration from the Data Perspective. NeurIPS 2023.
Yiran Wang, Taro Watanabe, Masao Utiyama and Yuji Matsumoto. 2023. 24-bit Languages. IJCNLP-AACL 2023.
Xincan Feng, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2023. Model-based Subsampling for Knowledge Graph Completion. IJCNLP-AACL 2023.
Shuhei Kurita, Naoki Katsura and Eri Onami. 2023. RefEgo: Referring Expression Comprehension Dataset from First-Person Perception of Ego4D. ICCV 2023.
Chihiro Taguchi, Yusuke Sakai, Parisa Haghani and David Chiang. 2023. Universal Automatic Phonetic Transcription into the International Phonetic Alphabet. Interspeech 2023.
Hiroyuki Deguchi, Taro Watanabe, Yusuke Matsui, Masao Utiyama, Hideki Tanaka and Eiichiro Sumita. 2023. Subset Retrieval Nearest Neighbor Machine Translation. ACL 2023.
Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2023. Table and Image Generation for Investigating Knowledge of Entities in Pretrained Vision and Language Models. ACL 2023.
Ying Zhang, Hidetaka Kamigaito and Manabu Okumura. 2023. Bidirectional Transformer Reranker for Grammatical Error Correction. ACL 2023 Findings.
Miyu Oba, Tatsuki Kuribayashi, Hiroki Ouchi and Taro Watanabe. 2023. Second Language Acquisition of Neural Language Models. ACL 2023 Findings.
Aru Maekawa, Hidetaka Kamigaito, Kotaro Funakoshi and Manabu Okumura. 2023. Generative Replay Inspired by Hippocampal Memory Indexing for Continual Language Learning. EACL 2023.
Jingun Kwon, Hidetaka Kamigaito, Young-In Song and Manabu Okumura. 2023. Hierarchical Label Generation for Text Classification.
Jingun Kwon, Hidetaka Kamigaito and Manabu Okumura. 2023. Abstractive Document Summarization with Summary-length Prediction. EACL 2023 Findings.
Ukyo Honda, Taro Watanabe and Yuji Matsumoto. 2023. Switching to Discriminative Image Captioning by Relieving a Bottleneck of Reinforcement Learning. WACV 2023.
Francisco Casacuberta, George Foster, Guoping Huang, Philipp Koehn, Geza Kovacs, Lemao Liu, Shuming Shi, Taro Watanabe and Chengqing Zong. 2022. Findings of the Word-Level AutoCompletion Shared Task in WMT 2022. WMT 2022.
Hiroyuki Deguchi, Kenji Imamura, Masahiro Kaneko, Yuto Nishida, Yusuke Sakai, Justin Vasselli, Huy Hien Vu and Taro Watanabe. 2022. NAIST-NICT-TIT WMT22 General MT Task Submission. WMT 2022.
Huayang Li, Deng Cai, Jin Xu and Taro Watanabe. 2022. N-gram Is Back: Residual Learning of Neural Text Generation with n-gram Language Model. EMNLP 2022 Findings.
Jungmin Choi, Ukyo Honda, Taro Watanabe, Hiroki Ouchi and Kentaro Inui. 2022. Law retrieval with supervised contrastive learning using the hierarchical structure of law. PACLIC 36.
Shuhei Kurita, Hiroki Ouchi, Kentaro Inui and Satoshi Sekine. 2022. Iterative Span Selection: Self-Emergence of Resolving Orders in Semantic Role Labeling. COLING 2022.
Zhi Qu and Taro Watanabe. 2022. Adapting to Non-Centered Languages for Zero-shot Multilingual Translation. COLING 2022.
Shiki Sato, Reina Akama, Hiroki Ouchi, Ryoko Tokuhisa, Jun Suzuki and Kentaro Inui. 2022. N-best Response-based Analysis of Contradiction-awareness in Neural Response Generation Models. SIGDIAL 2022.
Masao Ideuchi, Masatoshi Tsuchiya, Yiran Wang and Masao Utiyama. 2022. NICTmed at the NCTIR-16 Real-MedNLP Task. NTCIR-16.
Hidetaka Kamigaito and Katsuhiko Hayashi. 2022. Comprehensive Analysis of Negative Sampling in Knowledge Graph Representation Learning. ICML 2022.
Jiannan Xiang, Huayang Li, Defu Lian, Guoping Huang, Taro Watanabe and Lemao Liu. 2022. Visualizing the Relationship Between Encoded Linguistic Information and Task Performance. ACL 2022 Findings.
Zuchao Li, Yiran Wang, Masao Utiyama, Eiichiro Sumita, Hai Zhao and Taro Watanabe. 2022. What Works and Doesn’t Work, A Deep Decoder for Neural Machine Translation. ACL 2022 Findings.
Yushi Hirose, Masashi Shimbo and Taro Watanabe. 2021. Transductive Data Augmentation with Relational Path Rule Mining for Knowledge Graph Embedding. 2021 IEEE International Conference on Big Knowledge (ICBK).
Yuki Yamamoto, Yuji Matsumoto and Taro Watanabe. 2021. Dependency Patterns of Complex Sentences and Semantic Disambiguation for Abstract Meaning Representation Parsing. *SEM 2021.
Yiran Wang, Hiroyuki Shindo, Yuji Matsumoto and Taro Watanabe. 2021. Nested Named Entity Recognition via Explicitly Excluding the Influence of the Best Path. ACL-IJCNLP 2021.
Wei Bi, Huayang Li and Jiacheng Huang. 2021. Data Augmentation for Text Generation Without Any Augmented Data. ACL-IJCNLP 2021.
Deng Cai, Yan Wang, Huayang Li, Wai Lam and Lemao Liu. 2021. Neural Machine Translation with Monolingual Translation Memory. ACL-IJCNLP 2021.
Huayang Li, Lemao Liu, Guoping Huang and Shuming Shi. 2021. GWLAN: General Word-Level AutocompletioN for Computer-Aided Translation. ACL-IJCNLP 2021.
Yiran Wang, Hiroyuki Shindo, Yuji Matsumoto and Taro Watanabe. 2021. Structured Refinement for Sequential Labeling. ACL-IJCNLP 2021 Findings.
Jiannan Xiang, Yahui Liu, Deng Cai, Huayang Li, Defu Lian and Lemao Liu. 2021. Assessing Dialogue Systems with Distribution Distances. ACL-IJCNLP 2021 Findings.
Shohei Higashiyama, Masao Utiyama, Taro Watanabe and Eiichiro Sumita. 2021. User-Generated Text Corpus for Evaluating Japanese Morphological Analysis and Lexical Normalization. NAACL-HLT 2021.
Ukyo Honda, Yoshitaka Ushiku, Atsushi Hashimoto, Taro Watanabe and Yuji Matsumoto. 2021. Removing Word-Level Spurious Alignment between Images and Pseudo-Captions in Unsupervised Image Captioning. EACL 2021.
Vu Tran, Van-Hien Tran, Phuong Minh Nguyen, Chau Minh Nguyen, Ken Satoh, Yuji Matsumoto and Minh Le Nguyen. 2021. CovRelex: A COVID-19 Retrieval System with Relation Extraction. EACL 2021: Demo Track.
Yuya Sawada, Takashi Wada, Takayoshi Shibahara, Hiroki Teranishi, Shuhei Kondo, Hiroyuki Shindo, Taro Watanabe and Yuji Matsumoto. 2020. Coordination Boundary Identification without Labeled Data for Compound Terms Disambiguation. COLING 2020.
Ikuya Yamada, Akari Asai, Hiroyuki Shindo, Hideaki Takeda and Yuji Matsumoto. 2020. LUKE: Deep Contextualized Entity Representations with Entity-aware Self-attention. EMNLP 2020.

ワークショップ

Daiki Yoshida, Hiroyuki Deguchi, Yusuke Sakai, Hidetaka Kamigaito, Taro Watanabe. 2026. TableMBR: Minimum Bayes Risk Table Generation Based on Structural Consistency. ACL Student Research Workshop (SRW) 2026.
Liu Hanze, Yusuke Sakai and Taro Watanabe. 2026. Towards Singable Lyrics Translation Using Large Language Models. EACL Student Research Workshop (SRW) 2026.
Haruki Sakajo, Hiroshi Takato, Hiroshi Tsutsui, Komei Soda, Hidetaka Kamigaito and Taro Watanabe. 2025. Toward Automatic Safe Driving Instruction: A Large-Scale Vision Language Model Approach. MMLoSo Workshop 2025: Multimodal Models for Low-Resource Contexts and Social Impact.
Zhi Qu, Yiran Wang, Chenchen Ding, Hideki Tanaka, Masao Utiyama and Taro Watanabe. 2025. Improving Language Transfer Capability of Decoder-only Architecture in Multilingual Neural Machine Translation. MRL Workshp 2025.
Ashmari Pramodya, Yusuke Sakai, Justin Vasselli, Hidetaka Kamigaito and Taro Watanabe. 2025. Translating Movie Subtitles by Large Language Models using Movie-meta Information. ACL Student Research Workshop (SRW) 2025.
Takumi Goto, Justin Vasselli and Taro Watanabe. 2025. Improving Explainability of Sentence-level Metrics via Edit-level Attribution for Grammatical Error Correction. ACL Student Research Workshop (SRW) 2025.
Toma Suzuki, Yusuke Sakai, Justin Vasselli, Hidetaka Kamigaito and Taro Watanabe. 2025. Superfluous Instruction: Vulnerabilities Stemming from Task-Specific Superficial Expressions in Instruction Templates. The 3rd Workshop on Towards Knowledgeable Foundation Models (KnowFM 2025).
Toma Suzuki, Ayuki Katayama, Seiji Gobara, Ryo Tsujimoto, Hibiki Nakatani, Kazuki Hayashi, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. Reliability of Distribution Predictions by LLMs: Insights from Counterintuitive Pseudo-Distributions. NAACL Student Research Workshop (SRW) 2025.
Seiji Gobara, Hidetaka Kamigaito and Taro Watanabe. 2025. Speaker Identification and Dataset Construction Using LLMs: A Case Study on Japanese Narratives. The 7th Workshop on Narrative Understanding (WNU 2025).
Akari Haga, Akiyo Fukatsu, Miyu Oba, Arianna Bisazza and Yohei Oseki. 2024. BabyLM Challenge: Exploring the effect of variation sets on language model training efficiency. The 2nd BabyLM Challenge at the 28th Conference on Computational Natural Language Learning. Outstanding Paper Award
Adam Nohejl, Akio Hayakawa, Yusuke Ide and Taro Watanabe. 2024. Difficult for Whom? A study of Japanese Lexical Complexity. The Third Workshop on Text Simplification, Accessibility and Readability (TSAR 2024).
Yusuke Sakai, Adam Nohejl, Jiangnan Hang, Hidetaka Kamigaito and Taro Watanabe. 2024. Toward the Evaluation of Large Language Models Considering Score Variance across Instruction Templates. The BlackboxNLP Workshop (BlackboxNLP 2024).
Ayuki Katayama, Yusuke Sakai, Shohei Higashiyama, Hiroki Ouchi, Ayano Takeuchi, Ryo Bando, Yuta Hashimoto, Toshinobu Ogiso and Taro Watanabe. 2024. Evaluating Language Models in Location Referring Expression Extraction from Early Modern and Contemporary Japanese Texts. The 4th International Workshop on Natural Language Processing for Digital Humanities (NLP4DH 2024).
Yuji Oshima, Hiroyuki Shindo, Hiroki Teranishi, Hiroki Ouchi and Taro Watanabe. 2024. Synthetic Context with LLM for Entity Linking from Scientific Tables. SDProc 2024.
Xincan Feng, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2024. Unified Interpretation of Smoothing Methods for Negative Sampling Loss Functions in Knowledge Graph Embedding. Repl4NLP 2024.
Ken Nishida, Kojiro Machi, Kazuma Onishi, Katsuhiko Hayashi and Hidetaka Kamigaito. 2024. Multi-label Learning with Random Circular Vectors. Repl4NLP 2024.
Kosuke Doi, Yuka Ko, Mana Makinae, Katsuhito Sudoh and Satoshi Nakamura. 2024. Word Order in English-Japanese Simultaneous Interpretation: Analyses and Evaluation using Chunk-wise Monotonic Translation. IWSLT 2024.
Yuka Ko, Ryo Fukuda, Yuta Nishikawa, Yasumasa Kano, Tomoya Yanagita, Kosuke Doi, Mana Makinae, Haotian Tan, Makoto Sakai, Sakriani Sakti, Katsuhito Sudoh and Satoshi Nakamura. 2024. NAIST Simultaneous Speech Translation System for IWSLT 2024. IWSLT 2024.
Yuhi Matogawa, Yusuke Sakai, Taro Watanabe and Chihiro Taguchi. 2024. Japanese Rule-based Grapheme-to-phoneme Conversion System and Multilingual Named Entity Dataset with International Phonetic Alphabet. SIGMORPHON 2024.
Justin Vasselli, Arturo Martínez Peguero, Junehwan Sung and Taro Watanabe. 2024. Applying Linguistic Expertise to LLMs for Educational Material Development in Indigenous Languages. AmericasNLP 2024. 1st Prize in the Shared Task 2
Matthew Shardlow, Fernando Alva-Manchego, Riza Batista-Navarro, Stefan Bott, Saul Calderon Ramirez, Rémi Cardon, Thomas François, Akio Hayakawa, Andrea Horbach, Anna Huelsing, Yusuke Ide, Joseph Marvin Imperial, Adam Nohejl, Kai North, Laura Occhipinti, Nelson Peréz Rojas, Nishat Raihan, Tharindu Ranasinghe, Martin Solis Salazar, Sanja Stajner, Marcos Zampieri and Horacio Saggion. 2024. The BEA 2024 Shared Task on the Multilingual Lexical Simplification Pipeline. BEA 2024.
Kosuke Doi, Katsuhito Sudoh and Satoshi Nakamura. 2024. Automated Essay Scoring Using Grammatical Variety and Errors with Multi-Task Learning and Item Response Theory. BEA 2024.
Arturo Martinez Peguero. 2024. Change My Frame: Reframing in the Wild in r/ChangeMyView. LatinXinAI (to appear).
Matthew Shardlow, Fernando Alva-Manchego, Riza Batista-Navarro, Stefan Bott, Saul Calderon Ramirez, Rémi Cardon, Thomas François, Akio Hayakawa, Andrea Horbach, Anna Hülsing, Yusuke Ide, Joseph Marvin Imperial, Adam Nohejl, Kai North, Laura Occhipinti, Nelson Peréz Rojas, Nishat Raihan, Tharindu Ranasinghe, Martin Solis Salazar, Marcos Zampieri and Horacio Saggion. 2024. An Extensible Massively Multilingual Lexical Simplification Pipeline Dataset using the MultiLS Framework. 3rd Workshop on Tools and Resources for People with REAding DIfficulties (READI).
Yuto Nishida, Makoto Morishita, Hidetaka Kamigaito and Taro Watanabe. 2024. Generating Diverse Translation with Perturbed kNN-MT. EACL 2024 Student Research Workshop.
Miyu Oba, Akari Haga, Akiyo Fukatsu and Yohei Oseki. 2023. BabyLM Challenge: Curriculum learning based on sentence complexity approximating language acquisition. the BabyLM Challenge at the 27th Conference on Computational Natural Language Learning.
Justin Vasselli, Christopher Vasselli, Adam Nohejl and Taro Watanabe. 2023. NAISTeacher: A Prompt and Rerank Approach to Generating Teacher Utterances in Educational Dialogues. 18th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2023). 1st Rank in BEA 2023 Shared Task
Justin Vasselli and Taro Watanabe. 2023. A Closer Look at k-Nearest Neighbors Grammatical Error Correction. 18th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2023).
Yusuke Ide, Masato Mita, Adam Nohejl, Hiroki Ouchi, and Taro Watanabe. 2023. Japanese Lexical Complexity for Non-Native Readers: a New Dataset. 18th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2023).
Akio Hayakawa, Tomoyuki Kajiwara, Hiroki Ouchi and Taro Watanabe. 2022. JADES: New Text Simplification Dataset in Japanese Targeted at Non-Native Speakers. Workshop on Text Simplification, Accessibility, and Readability (TSAR-2022).
Xincan Feng, Zhi Qu, Yuchang Cheng, Taro Watanabe and Nobuhiro Yugami. 2022. Sharing Parameter by Conjugation for Knowledge Graph Embeddings in Complex Space. TextGraphs-16.
Chihiro Taguchi, Sei Iwata and Taro Watanabe. 2022. Universal Dependencies Treebank for Tatar: Incorporating Intra-Word Code-Switching Information. Workshop on Resources and Technologies for Indigenous, Endangered and Lesser-resourced Languages (EURALI-2022).
Van-Hien Tran, Hiroki Ouchi, Taro Watanabe and Yuji Matsumoto. 2022. Improving Discriminative Learning for Zero-Shot Relation Extraction. 1st Workshop on Semiparametric Methods in NLP: Decoupling Logic from Knowledge (SpaNLP).
Shohei Higashiyama, Masao Utiyama, Taro Watanabe and Eiichiro Sumita. 2021. A Text Editing Approach to Joint Japanese Word Segmentation, POS Tagging, and Lexical Normalization. Seventh Workshop on Noisy User-generated Text (W-NUT 2021). Best Paper Award
Yushi Hirose, Shimbo Masashi and Taro Watanabe. 2021. Transductive Data Augmentation with Relational Path Rule Induction for Knowledge Graph Embedding. International Workshop on Knowledge Graph: Heterogeneous Graph Deep Learning and Applications.
Shintaro Harada and Taro Watanabe. 2021. Neural Machine Translation with Synchronous Latent Phrase Structure. ACL-IJCNLP 2021 Student Research Workshop.
Sei Iwata, Taro Watanabe and Masaaki Nagata. 2021. Zero Pronouns Identification based on Span prediction. ACL-IJCNLP 2021 Student Research Workshop.
Hiroyuki Deguchi, Akihiro Tamura and Takashi Ninomiya. 2021. Synchronous Syntactic Attention for Transformer Neural Machine Translation. ACL-IJCNLP 2021 Student Research Workshop.
Chihiro Taguchi, Yusuke Sakai and Taro Watanabe. 2021. Transliteration for Low-Resource Code-Switching Texts: Building an Automatic Cyrillic-to-Latin Converter for Tatar. Fifth Workshop on Computational Approaches to Linguistic Code-Switching (CALCS 2021).
Takayoshi Shibahara, Ikuya Yamada, Noriki Nishida, Shanshan Liu, Kouji Kozaki, Taro Watanabe and Yuji Matsumoto. 2020. Preliminary Experiments of Span-based Distant Supervision for Biomedical NER. Fourth International Workshop on SCIentific DOCument Analysis (SCIDOCA 2020).
Yuya Sawada, Hiroki Teranishi and Yuji Matsumoto. 2020. Coordination Identification for Composite Named Entity Normalization. Fourth International Workshop on SCIentific DOCument Analysis (SCIDOCA 2020).
Hien Van Tran, Phuong Minh Nguyen, Chau Minh Nguyen, Ken Satoh, Yuji Matsumoto and Minh Le Nguyen. 2020. CovRelex: A COVID-19 Retrieval System with Relation Extraction. Fourth International Workshop on SCIentific DOCument Analysis (SCIDOCA 2020).
Shanshan Liu, Matsunori Uenuma, Hiroyuki Shindo and Yuji Matsumoto. 2020. Extraction of the Material Synthesis Procedure. Fourth International Workshop on SCIentific DOCument Analysis (SCIDOCA 2020).

国内会議・研究会

王略丞, 林克彦, 上垣外英剛. 2026. メタファー判断における LLM-as-a-Judge の安定性分析：モデル・プロンプト・人間判断の比較. 言語処理学会第32回年次大会.
尾崎慎太郎, 橋本航, 林克彦, 上垣外英剛, 渡辺太郎. 2026. n-gramに基づく推論モデルの信頼度と較正特性の分析. 言語処理学会第32回年次大会.
Yuka Ko, Ryo Fukuda, Yuta Nishikawa, Yasumasa Kano, Katsuhito Sudoh, Sakriani Sakti, Satoshi Nakamura. 2026. End-to-end Simultaneous Speech Translation with Style Tags using Human Simultaneous Interpretation Data. 言語処理学会第32回年次大会.
城戸晴輝, 上垣外英剛, 村上聡一朗, 高村大也, 奥村学. 2026. 読者の質問と予想が駆動する物語生成. 言語処理学会第32回年次大会.
Riza Setiawan Soetedjo, Yusuke Sakai, Hidetaka Kamigaito, Jingun Kwon, Manabu Okumura, Taro Watanabe. 2026. Toward Factual Summarization through Consensus and Consistency. 言語処理学会第32回年次大会.
澤田悠冶, 安井雄一郎, 渡辺太郎. 2026. 日本語エンティティ曖昧性解消の体系的評価. 言語処理学会第32回年次大会.
橋本航, 上垣外英剛, 渡辺太郎. 2026. データ拡張による固有表現抽出の不確実性推定. 言語処理学会第32回年次大会.
坂上温紀, Zhi Qu, 上垣外英剛, 高村大也, 谷中瞳, 渡辺太郎. 2026. 大規模視覚言語モデルにおける視覚情報の伝播経路と Registering の考察. 言語処理学会第32回年次大会.
Justin Vasselli, Arturo Martínez Peguero, Frederikus Hudi, 坂上温紀, 渡辺太郎. 2026. Measuring Linguistic Competence of LLMs on Indigenous Languages of the Americas. 言語処理学会第32回年次大会.
馮思遠, 林克彦, 上垣外英剛, 鷲尾光樹, 平尾努. 2026. レイアウト構造木を介したマンガページ生成手法：視覚・テキスト特徴の有効性比較. 言語処理学会第32回年次大会.
王略丞, 尾崎慎太郎, 上垣外英剛, 林克彦, Jingun Kwon, 奥村学, 渡辺太郎. 2026. 画像生成モデルにおける直喩喩体の生成挙動分析. 言語処理学会第32回年次大会. 委員特別賞
鼎凌太朗, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. ミーム画像に対する自己スコアリング選別による推論根拠付き回答の検証. 言語処理学会第32回年次大会.
志子田直輝, 五藤巧, 西田悠人, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. CLIPと不均衡最適輸送を用いた画像–文章間の類似性評価および局所アライメントの可視化. 言語処理学会第32回年次大会.
門谷拓能, 神野倫行, 坂井優介, 渡辺太郎. 2026. 出力制約と表記正規化による LLM 形式証明のタクティク選択評価. 言語処理学会第32回年次大会.
坂上温紀, Frederikus Hudi, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. 全域木による言語モデルの分析. 言語処理学会第32回年次大会.
出口祥之, 帖佐克己, 坂井優介. 2026. 単一のhubテキストがCLIPを壊す：hubnessによるクロスモーダル埋め込みの脆弱性特定. 言語処理学会第32回年次大会. 委員特別賞
Maria Angelica Riera Machin, Adam Nohejl, Taro Watanabe. 2026. Using the CEFR for Guiding LLMs in Lexical Complexity Prediction. 言語処理学会第32回年次大会.
蒔苗茉那, 五藤巧, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. 文埋め込みモデルの内部表現と不均衡最適輸送を用いた機械翻訳自動評価. 言語処理学会第32回年次大会.
上垣外英剛, 村上聡一朗, 張培楠. 2026. 広告文におけるスパン単位の誤り推定. 言語処理学会第32回年次大会.
尾崎慎太郎, 平岡達也, 大竹啓永, 大内啓樹, 磯沼大, Benjamin Heinzerling, 乾健太郎, 渡辺太郎, 宮尾祐介, 大関洋平, 高木優. 2026. 大規模言語モデルの潜在言語は一貫しているべきか？. 言語処理学会第32回年次大会. 委員特別賞
加藤優汰, 尾崎慎太郎, 林和樹, 坂井優介, 上垣外英剛, 林克彦, 渡辺太郎. 2026. 知識グラフの反復的な探索による画像の詳細な説明文の生成. 言語処理学会第32回年次大会.
水津徹久, 東山翔平, 進藤裕之, 大内啓樹, サクティサクリアニ. 2026. 空間・エンティティ制約下における地理空間推論のための構成的質問応答ベンチマークの自動生成. 言語処理学会第32回年次大会.
藤田剛, 澤田悠冶, 坂井優介, 渡辺太郎. 2026. 法令間委任関係におけるマルチラベル委任先条文特定. 言語処理学会第32回年次大会.
平川稜真, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. 大規模言語モデルにおける方言生成過程の内部機序分析. 言語処理学会第32回年次大会.
Juseon Do, Sungwoo Han, Jingun Kwon, 上垣外英剛, 林克彦, 渡辺太郎. 2026. 自己整列プロンプティング：長文脈下のランキングタスクのための整列手法. 言語処理学会第32回年次大会.
井手佑翼, Adam Nohejl, Joshua Tanner, 谷中瞳, Christopher Lindsay, 渡辺太郎. 2026. 日本語学習者辞書語釈の自動生成. 言語処理学会第32回年次大会.
Adam Nohejl, Akio Hayakawa, Yusuke Ide, Taro Watanabe. 2026. A Japanese Dataset and Efficient Multilingual LLM-Based Methods for Lexical Simplification and Lexical Complexity Prediction. 言語処理学会第32回年次大会.
村上聡一朗, 上垣外英剛, 高村大也, 奥村学. 2026. 個別選好の異質性を考慮した大喜利ユーモア選好要因の分析. 言語処理学会第32回年次大会. 委員特別賞
長谷川遼, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. JSONFOL: JSON 形式論理式によるニューロシンボリック推論. 言語処理学会第32回年次大会.
辻航平, 岡佑依, 西田京介, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. 疑似グラフデータ学習によるLLMのグラフ理解能力の向上. 言語処理学会第32回年次大会.
北野由香利, 林克彦, 上垣外英剛. 2026. 飲食店名は何を語るか：価格と評価に関わる n-gram 特徴量の分析. 言語処理学会第32回年次大会.
横野光, 平岡達也, 関根聡. 2026. Rationaleの自動生成によるCoTデータセット構築. 言語処理学会第32回年次大会.
大竹啓永, 平岡達也, 宮尾祐介, 大関洋平, 磯沼大. 2026. データマージ:平均化データを用いた学習効率化. 言語処理学会第32回年次大会.
五藤巧, 坂井優介, 渡辺太郎. 2026. LLMベース文法誤り訂正における編集の多数決による過剰訂正の抑制. 言語処理学会第32回年次大会.
帖佐宗浩, 西田悠人, 大羽未悠, 渡辺太郎. 2026. ニューラル言語モデルの学習初期における単語の分節化. 言語処理学会第32回年次大会.
Kit May Shum, Yusuke Sakai, Masahiro Kaneko, Taro Watanabe. 2026. Personality-Aware Suicide Severity Level Detection Using Large Language Models. 言語処理学会第32回年次大会.
唐澤香梨菜, 金山龍起, 幸喜礼佳, 鈴村祐貴, 藤田晴斗, 小原涼馬, 坂井優介, 上垣外英剛, 林克彦, 松野省吾. 2026. InterviewArena：情報量の欠損度合いに着目した不完全情報下での対話型推論能力ベンチマーク. 言語処理学会第32回年次大会.
五藤巧, 坂井優介, 渡辺太郎. 2026. 文法誤り訂正における編集ベクトルの最適輸送に基づく性能評価尺度. 言語処理学会第32回年次大会.
呂博軒, 村上聡一朗, 上垣外英剛, 張培楠. 2026. 類推に基づくエキスパート割当：kNN検索を用いたMixture-of-Experts. 言語処理学会第32回年次大会. 優秀賞
片岡晴彦, 辻航平, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. Tighter Locality: 大規模言語モデルにおける知識編集手法のより厳密な局所性評価. 言語処理学会第32回年次大会.
東山翔平, 大内啓樹, 橋本雄太, 藤田篤. 2026. 中世・近世日本語資料の現代語機械翻訳：評価用対訳データセットの構築とLLMの性能評価. 言語処理学会第32回年次大会.
土肥康輔, 蒔苗茉那, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. Simul-COMET: 原発話との語順差を考慮した同時通訳評価指標. 言語処理学会第32回年次大会.
吉田大城, 出口祥之, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. 構造的整合性に基づく最小ベイズリスクテーブル生成. 言語処理学会第32回年次大会.
大竹啓永, 張培楠, 坂井優介, 大内啓樹, 渡辺太郎. 2026. AdTEx：大規模言語モデルを活用した多様な広告テンプレート拡張フレームワーク. 言語処理学会第32回年次大会.
林和樹, 尾崎慎太郎, 神野倫行, 上垣外英剛, 渡辺太郎. 2026. Noisy Channel に基づく生成確率による画像生成評価. 言語処理学会第32回年次大会. 優秀賞
西田悠人, 森下睦, 上垣外英剛, 渡辺太郎. 2026. LLMの事前学習過程における翻訳能力の多面的評価. 自然言語処理研究会.
フディフレデリクス, ナナコーン新菜, バセリジャスティン, 坂井優介, 上垣外英剛, 田村晃裕, 渡辺太郎. 2026. Lecture Translation from Online Educational Videos. 自然言語処理研究会. 優秀研究賞
辻航平, 平岡達也, 乾健太郎, 渡辺太郎. 2026. ラテン文字体系言語を効率的に処理するためのLLM埋め込み空間の共有. 自然言語処理研究会. 若手奨励賞
門谷拓能, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. 大規模言語モデルによるCPUアーキテクチャごとの特性を考慮したコンパイラ最適化. 自然言語処理研究会. 若手奨励賞
北野雄士, 西田悠人, 坂上温紀, 上垣外英剛, 渡辺太郎. 2026. 独立成分分析による大規模視覚言語モデルの画像表現の分析. 自然言語処理研究会.
藤田剛, 澤田悠冶, 坂井優介, 渡辺太郎. 2025. 法令文における法令間委任関係の自動抽出. 自然言語処理研究会. 優秀研究賞
帖佐宗浩, 西田悠人, 大羽未悠, 渡辺太郎. 2025. ニューラル言語モデルの学習初期における単語の分節化. 自然言語処理研究会.
岩國巧, 出口祥之, 永田昌明, 上垣外英剛, 渡辺太郎. 2025. 誤り単語の混入による単語単位翻訳誤り検出の頑健性評価. 自然言語処理研究会. 優秀研究賞
尾崎慎太郎, 加藤優汰, 馮思遠, 富田雅代, 林和樹, 小原涼馬, 小山田昌史, 林克彦, 上垣外英剛, 渡辺太郎. 2025. 検索拡張生成が信頼度に及ぼす影響：医療分野における分析. 言語処理学会第31回年次大会.
片山歩希, 東山翔平, 大内啓樹, 坂井優介, 竹内綾乃, 坂東諒, 橋本雄太, 小木曽智信, 渡辺太郎. 2025. 近世・近代・現代日本語テキストに対する場所参照表現抽出. 言語処理学会第31回年次大会.
蒔苗茉那, 坂井優介, 上垣外英剛, 渡辺太郎. 2025. 訳出の同時性に特化した評価データを用いた同時音声翻訳モデルの評価と分析. 言語処理学会第31回年次大会. みらい翻訳賞
Zhe Cao, Yusuke Oda, Akiko Aizawa, Taro Watanabe. 2025. Towards Modular Fine-tuning of LLM-based Multilingual Neural Machine Translation. 言語処理学会第31回年次大会.
土肥康輔, 胡尤佳, 蒔苗茉那, 須藤克仁, 中村哲, 渡辺太郎. 2025. 順送り訳データに基づく英日同時機械翻訳の評価. 言語処理学会第31回年次大会.
田口智大, 倉部慶太, 坂井優介, Rita Seng Mai Nbanpa. 2025. フィールドワークデータによるジンポー語機械翻訳. 言語処理学会第31回年次大会.
澤田悠冶, 大内啓樹, 安井雄一郎, 寺西裕紀, 松本裕治, 渡辺太郎, 石井昌之. 2025. 沿革情報を用いた企業名変遷の構造化. 言語処理学会第31回年次大会.
郷原聖士, 上垣外英剛, 渡辺太郎. 2025. 大規模言語モデルを用いた物語分析データセットの効率的構築：日本語物語の話者推定を例として. 言語処理学会第31回年次大会.
北野雄士, 西田悠人, 坂上温紀, 上垣外英剛, 渡辺太郎. 2025. 独立成分分析による事前学習済み多言語モデルの層を横断した単語埋め込み表現の分析. 言語処理学会第31回年次大会.
西田悠人, 志子田直輝, 岸波洋介, 藤井諒, 森下睦, 上垣外英剛, 渡辺太郎. 2025. Wikipediaリダイレクト情報を活用したエンティティベース質問応答データセットの構築. 言語処理学会第31回年次大会.
鈴木刀磨, 片山歩希, 郷原聖士, 辻本陵, 中谷響, 林和樹, 坂井優介, 上垣外英剛, 渡辺太郎. 2025. 大規模言語モデルの分布予測における常識に基づいた割合予測能力の評価. 言語処理学会第31回年次大会. 委員特別賞
橋本航, 上垣外英剛, 渡辺太郎. 2025. 復号手法が大規模言語モデルにおける不確実性推定に与える影響の調査. 言語処理学会第31回年次大会.
坂上温紀, 坂井優介, 上垣外英剛, 渡辺太郎. 2025. 満洲語古典語における母音調和の計算言語学的考察. 言語処理学会第31回年次大会.
坂井優介, 五藤巧, 渡辺太郎. 2025. IMPARA-GED：言語モデルの文法誤り検出能力に着目した文法誤り訂正の参照文なし自動評価. 言語処理学会第31回年次大会. 若手奨励賞
Justin Vasselli, Arturo Martínez Peguero, 渡辺太郎. 2025. Incorporating Rule-Based Methods with Prompt-Based Techniques for Indigenous Language Generation. 言語処理学会第31回年次大会.
五藤巧, 坂井優介, 渡辺太郎. 2025. 文法誤り訂正における人手評価と自動評価の乖離とその解決. 言語処理学会第31回年次大会.
吉田大城, 林和樹, 坂井優介, 上垣外英剛, 林克彦, 渡辺太郎. 2025. 大規模視覚言語モデルにおける言語タスクに対する視覚情報の影響. 言語処理学会第31回年次大会. 委員特別賞
芳賀あかり, 深津聡世, 大羽未悠, Arianna Bisazza, 大関洋平. 2025. 言語モデルの事前学習におけるバリエーションセットの効果. 言語処理学会第31回年次大会. 若手奨励賞
Adam Nohejl, 渡辺太郎. 2025. Dispersion Measures as Predictors of Lexical Decision Time, Word Familiarity, and Lexical Complexity. 言語処理学会第31回年次大会.
河野真有香, 平尾悠太朗, Monica Perusquía-Hernández, 内山英昭, 上垣外英剛, 清川清. 2025. LLMはASD小児と定型発達小児が作成したストーリーを識別できるか？. 言語処理学会第31回年次大会.
坂上温紀, Justin Vasselli, 井手佑翼, 坂井優介, Yingtao Tian, 上垣外英剛, 渡辺太郎. 2025. 低資源言語のための辞書を用いた言語間語彙転移. 言語処理学会第31回年次大会.
長谷川遼, 坂井優介, 上垣外英剛, 渡辺太郎. 2025. 知識編集がconfidence calibrationへ与える影響. 言語処理学会第31回年次大会.
辻本陵, 坪内孝太, 山下達雄, 松田裕貴, 諏訪博彦, 大内啓樹. 2025. レビュー情報を用いたLLMによる観光地比較表生成. 言語処理学会第31回年次大会.
上垣外英剛, 出口祥之, 坂井優介, 林克彦, 渡辺太郎. 2025. 最小ベイズリスク復号におけるバイアスと多様性の分解. 言語処理学会第31回年次大会.
杉山咲, 蒔苗茉那, 片山歩希, 坂井優介, 山口賢一, 渡辺太郎. 2025. 大規模言語モデルを用いたソースコードからのドキュメント生成能力調査. 言語処理学会第31回年次大会.
Ying Zhang, 上垣外英剛, 奥村学. 2025. Bidirectional Transformer Reranker for Grammatical Error Correction. 言語処理学会第31回年次大会.
坂井優介, 上垣外英剛, 林克彦, 渡辺太郎. 2025. 未知の知識に対する事前学習済み言語モデルが持つ推論能力の調査. 言語処理学会第31回年次大会.
中谷響, 安井雄一郎, 若本亮佑, 石井昌之, 大内啓樹, 渡辺太郎. 2025. Wikidataに基づく大規模ジオコーディングデータセット. 言語処理学会第31回年次大会. 若手奨励賞
尾崎慎太郎, 平岡達也, 大竹啓永, 大内啓樹, 渡辺太郎, 宮尾祐介, 大関洋平, 高木優. 2025. 大規模言語モデルにおけるペルソナの役割と内部動作の理解. 言語処理学会第31回年次大会.
大南英理, 宮西大樹, 前田航希, 栗田修平. 2025. 多言語での判例事実概要からの法的関係性のグラフ可視化. 言語処理学会第31回年次大会. 委員特別賞
佐藤岳大, 尾崎慎太郎, 横山大作. 2025. 戦略的発話の多様な生成を目指した人狼エージェントの構築. 言語処理学会第31回年次大会.
西田悠人, 小田悠介, Namgi Han, 高木優, 宮尾祐介. 2025. 日本語大規模言語モデルの事前訓練過程における下流タスク性能の網羅的な分析. 言語処理学会第31回年次大会.
大竹啓永, 張培楠, 坂井優介, 三田雅人, 大内啓樹, 渡辺太郎. 2025. 広告画像ランキングによる視覚言語モデルの評価. 言語処理学会第31回年次大会.
Kosuke Doi, Katsuhito Sudoh, Satoshi Nakamura. 2025. NAIST Simultaneous Interpretation Corpus: Development and Analyses of Data from Interpreters of Different Levels. 言語処理学会第31回年次大会.
村上聡一朗, 張培楠, 上垣外英剛, 高村大也, 奥村学. 2025. AdParaphrase: 魅力的な広告表現の分析を目的とした広告文言い換えデータセット. 言語処理学会第31回年次大会.
大西雄真, 西田拳, 林克彦, 上垣外英剛. 2025. Gated Recurrent Unitの簡略化と学習型Bloom Filterへの影響. 言語処理学会第31回年次大会.
林和樹, 上垣外英剛, 幸田慎也, 渡辺太郎. 2025. IterKey: LLMを用いた反復的キーワード生成による検索拡張生成の最適化. 言語処理学会第31回年次大会.
五藤巧, 堤田恭太, 村瀬文彦, 三谷陽, 渡辺太郎. 2025. k近傍事例に基づく埋め込み表現のドメイン適応と検索への応用. 言語処理学会第31回年次大会.
中根稜介, 前川在, 上垣外英剛, 平尾努, 奥村学. 2025. 大規模言語モデルを用いたシフト還元型句構造解析. 言語処理学会第31回年次大会.
井手佑翼, Joshua Tanner, Adam Nohejl, Justin Vasselli, 上垣外英剛, 渡辺太郎. 2025. 複単語表現検出におけるLLMファインチューニングの有効性. 言語処理学会第31回年次大会.
Tomoyki Jinno, Kazuki Hayashi, Yusuke Sakai, Hidetaka Kamigaito, Taro Watanabe. 2025. Cosine Similarity as Logits?: Few-shot Knowledge Graph Completion with Embedding Vectors of a Generative PLM and its Application in Knowledge Probing. 言語処理学会第31回年次大会.
西田悠人, 小田悠介. 2025. LLMの学習過程におけるタスク性能の不安定性とその緩和. 自然言語処理研究会. 若手奨励賞
平野颯, 上垣外英剛, 渡辺太郎. 2025. 大規模言語モデルにおける言語知識の所在について. 自然言語処理研究会.
夏見昂樹, 出口祥之, 坂井優介, 上垣外英剛, 渡辺太郎. 2025. 知識蒸留モデルと合意をとる頑健な行列補完を用いた高速な確率的最小ベイズリスク復号. 自然言語処理研究会.
多田智貴, 林克彦, 上垣外英剛, 松野省吾. 2024. 登録に議論が必要なWikipedia項目への自動登録に向けた調査. 自然言語処理研究会.
尾崎慎太郎, 林和樹, 坂井優介, 上垣外英剛, 林克彦, 渡辺太郎. 2024. 大規模視覚言語モデルによる芸術作品の多言語説明生成. 自然言語処理研究会.
鈴木刀磨, 片山歩希, 郷原聖士, 辻本陵, 中谷響, 林和樹, 坂井優介, 上垣外英剛, 渡辺太郎. 2024. 大規模言語モデルによる選択肢間の関係を考慮した回答分布予測手法の提案. 自然言語処理研究会.
蒔苗茉那, 坂井優介, 上垣外英剛, 渡辺太郎. 2024. Simul-MuST-C：大規模言語モデルによる語順の単調性に着目した同時音声翻訳用コーパスの構築. 自然言語処理研究会. 若手奨励賞
五藤巧, 出口祥之, 上垣外英剛, 渡辺太郎. 2024. k近傍事例を用いたニューラルモデルの予測における定量的な解釈. 自然言語処理研究会.
井手佑翼, 西田悠人, 大羽未悠, 坂井優介, Justin Vasselli, 上垣外英剛, 渡辺太郎. 2024. 大規模言語モデルに適した容認性判断手法の検討. 自然言語処理研究会. 若手奨励賞
出口祥之, 坂井優介, 上垣外英剛, 渡辺太郎. 2024. 疑似参照訳文ベクトルの重心に基づく高速なニューラル最小ベイズリスク復号. 言語処理学会第30回年次大会. SmartESG (シェルパ・アンド・カンパニー) 賞
平野颯, 上垣外英剛, 渡辺太郎. 2024. 深層学習モデルにおける言語特徴分布に関する研究. 言語処理学会第30回年次大会.
大嶋悠司, 進藤裕之, 寺西裕紀, 大内啓樹, 渡辺太郎. 2024. LLM による合成文脈データを用いた表のエンティティリンキング. 言語処理学会第30回年次大会.
大南英理, 栗田修平, 宮西大樹, 渡辺太郎. 2024. JDocQA: 図表を含む日本語文書質問応答データセットによる大規模言語モデルチューニング. 言語処理学会第30回年次大会. 若手奨励賞 PKSHA Technology賞 Money Forward賞
郷原聖士, 上垣外英剛, 渡辺太郎. 2024. LLM はユーザーに適したテキストの難易度を暗黙的に考慮しているのか？. 言語処理学会第30回年次大会.
山本和太郎, 大友寛之, 大内啓樹, 東山翔平, 寺西裕紀, 進藤裕之, 渡辺太郎. 2024. 移動軌跡解析：文章中の人物の地理的な移動を読み取る. 言語処理学会第30回年次大会.
林和樹, 坂井優介, 上垣外英剛, 林克彦, 渡辺太郎. 2024. Large-scale Vision Language Modelによる芸術作品に対する説明の生成. 言語処理学会第30回年次大会.
齊藤成輝, 林和樹, 井手佑翼, 坂井優介, 鈴木刀磨, 郷原聖士, 大西雄真, 上垣外英剛, 林克彦, 渡辺太郎. 2024. Vision Language Modelが持つ画像批評能力の評価手法の提案. 言語処理学会第30回年次大会.
中谷響, 寺西裕紀, 東山翔平, 大内啓樹, 渡辺太郎. 2024. メンション文脈とエントリ属性を考慮した Transformer Bi-Encoder によるジオコーディング. 言語処理学会第30回年次大会.
東山翔平, 大内啓樹, 寺西裕紀, 大友寛之, 井手佑翼, 山本和太郎, 進藤裕之, 渡辺太郎. 2024. 日本語旅行記ジオパージングデータセットATD-MCL. 言語処理学会第30回年次大会. 委員特別賞
辻本陵, 大内啓樹, 上垣外英剛, 渡辺太郎. 2024. 衛星画像の時系列変化説明に向けたLVLMの比較. 言語処理学会第30回年次大会.
浅野輝, 米谷竜, 関井大気, 大内啓樹. 2024. Text2Traj2Text: 大規模言語モデルを活用した段階的データ生成に基づく人物移動軌跡の言語化. 言語処理学会第30回年次大会.
四條光, 進藤裕之, 渡辺太郎. 2024. 画像ベースとテキストベースのモデルを用いた表の構造解析の性能検証. 言語処理学会第30回年次大会.
Junehwan Sung, 上垣外英剛, 渡辺太郎. 2024. Exploring Metalinguistic Awareness in Pre-trained Language Models through the International Linguistics Olympiad Challenges. 言語処理学会第30回年次大会.
富村勇貴, 上垣外英剛, 渡辺太郎. 2024. 固有名詞置換による共参照解析データセットの拡張. 言語処理学会第30回年次大会.
五藤巧, 渡辺太郎. 2024. 文法誤り訂正における参照なし評価尺度を用いた分析的評価法. 言語処理学会第30回年次大会. 若手奨励賞
芳賀あかり, 菅原朔, 深津聡世, 大羽未悠, 大内啓樹, 渡辺太郎, 大関洋平. 2024. 小規模言語モデルによる子供の過剰一般化のモデリング. 言語処理学会第30回年次大会.
坂井優介, 上垣外英剛, 渡辺太郎. 2024. Multilingual CommonsenseQA. 言語処理学会第30回年次大会.
Justin Vasselli, Taro Watanabe. 2024. Adversarial Evaluation of Dialogue System Metrics. 言語処理学会第30回年次大会.
大羽未悠, 大関洋平, 深津聡世, 芳賀あかり, 大内啓樹, 渡辺太郎, 菅原朔. 2024. 言語モデルの文法知識評価における間接肯定証拠の分析. 言語処理学会第30回年次大会.
橋本航, 上垣外英剛, 渡辺太郎. 2024. データ拡張による固有表現抽出の不確実性推定. 言語処理学会第30回年次大会.
澤田悠冶, 安井雄一郎, 大内啓樹, 渡辺太郎, 石井昌之, 石原祥太郎, 山田剛, 進藤裕之. 2024. 日経企業 ID リンキングのための類似度ベース EL システムの構築と分析. 言語処理学会第30回年次大会.
前川在, 平尾努, 上垣外英剛, 奥村学. 2024. 大規模言語モデルによるシフト還元修辞構造解析の模倣. 言語処理学会第30回年次大会.
帖佐克己, 上垣外英剛, 渡辺太郎. 2024. 翻訳文の部分構造を制約とした機械翻訳. 言語処理学会第30回年次大会. 若手奨励賞
kNN言語モデルは低頻度語の予測に役立つか？. 2024. 西田悠人, 森下睦, 出口祥之, 上垣外英剛, 渡辺太郎. 言語処理学会第30回年次大会. 若手奨励賞
白井尚登, 上垣外英剛, 渡辺太郎. 2024. Scalar Mixing Weightsを用いた生成タスクにおける視覚と言語の情報を事前学習したモデルの分析. 自然言語処理研究会.
鈴木刀磨, 坂井優介, 上垣外英剛, 渡辺太郎. 2024. 大規模言語モデルにおけるタスク特有の表層表現に起因する脆弱性の調査. 自然言語処理研究会.
武内樹治, 大内啓樹, 東山翔平. 2023. 歴史災害史料からの自動地名抽出に向けた自然言語処理システムの性能評価. 人文科学とコンピュータシンポジウム2023.
西田拳, 林克彦, 町光二郎, 上垣外英剛. 2023. ランダム巡回ベクトルを用いたマルチラベル学習. 自然言語処理研究会.
片山歩希, 東山翔平, 大内啓樹, 渡辺太郎. 2023. 歴史的日本語資料を対象とした場所参照表現抽出―「おくのほそ道」を例として―. 自然言語処理研究会.
坂井優介, ノヘイルアダム, 上垣外英剛, 渡辺太郎. 2023. 大規模言語モデルの統一評価に向けた指示テンプレートの提案及びその評価結果の考察. 自然言語処理研究会. 優秀研究賞
坂井優介, 上垣外英剛, 林克彦, 渡辺太郎. 2023. 未知の知識に対する事前学習済み言語モデルが持つ推論能力の調査. 自然言語処理研究会. 優秀研究賞
山本和太郎, 東山翔平, 大内啓樹, 大友寛之, 井手佑翼, 進藤裕之, 渡辺太郎. 2023. 移動軌跡可視化のための旅行記への訪問順序アノテーション. 2023年度人工知能学会全国大会（第37回）.
大嶋悠司, 進藤裕之, 渡辺太郎. 2023. 引用文献に着目した情報科学論文からのデータセットの抽出. 自然言語処理研究会.
澤田悠冶, 寺西裕紀, 大内啓樹, 松本裕治, 渡辺太郎. 2023. 生成型Low-resouce固有表現認識における固有表現ラベル分散表現の推定法. 自然言語処理研究会.
廣瀬惟歩, 渡辺太郎. 2023. 日英翻訳を対象としたイディオム表現の評価指標の提案. 言語処理学会第29回年次大会.
五藤巧, 渡辺太郎. 2023. 訂正文の流暢性向上を目的とした系列タグ付け文法誤り訂正器の強化学習手法. 言語処理学会第29回年次大会.
西田悠人, 森下睦, 上垣外英剛, 渡辺太郎. 2023. 摂動を加えたkNN機械翻訳による多様な翻訳候補の生成. 言語処理学会第29回年次大会.
出口祥之, 渡辺太郎, 松井勇佑, 内山将夫, 田中英輝, 隅田英一郎. 2023. 近傍文検索を用いたサブセットkNNニューラル機械翻訳. 言語処理学会第29回年次大会.
大羽未悠, 栗林樹生, 大内啓樹, 渡辺太郎. 2023. 言語モデルの第二言語獲得. 言語処理学会第29回年次大会. 若手奨励賞
Xincan Feng, 上垣外英剛, 林克彦, 渡辺太郎. 2023. 知識グラフ補完のためのモデル予測に基づくサブサンプリング. 言語処理学会第29回年次大会.
星野智紀, 上垣外英剛, 渡辺太郎. 2023. 忠実性向上のためにn-gramの抽出性を報酬とする強化学習を用いる抽象型要約. 言語処理学会第29回年次大会.
亀井遼平, 横井祥, 仲村祐希, 渡辺太郎, 乾健太郎. 2023. 柔らかいジャンプ付き編集距離に向けて. 言語処理学会第29回年次大会.
張培楠, 坂井優介, 三田雅人, 大内啓樹, 渡辺太郎. 2023. AdGLUE: 広告言語理解ベンチマーク. 言語処理学会第29回年次大会.
芝原隆善, 山田育矢, 西田典起, 寺西裕紀, 大内啓樹, 古崎晃司, 渡辺太郎, 松本裕治. 2023. エンティティの階層的分類体系を用いた遠距離教師あり固有表現抽出. 言語処理学会第29回年次大会.
前川在, 小林尚輝, 平尾努, 上垣外英剛, 奥村学. 2023. 逆翻訳を利用したデータ拡張による文間の修辞構造解析の改善. 言語処理学会第29回年次大会.
的川雄飛, 坂井優介, 平野颯, 澤田悠冶, 大内啓樹, 渡辺太郎. 2023. ルールベースG2Pによる多言語固有表現の国際音声記号表記付きデータセットの構築. 言語処理学会第29回年次大会.
芳賀あかり, 平尾努, 帖佐克己, 本多右京, 出口祥之, 渡辺太郎. 2023. 画像キャプショニングのための制約語の抽出法. 言語処理学会第29回年次大会.
白井尚登, 上垣外英剛, 渡辺太郎. 2023. エッジプロービングを用いた事前学習済みの視覚と言語に基づくモデルにおける言語知識の分析. 言語処理学会第29回年次大会.
久本空海, 西尾悟, 井口奏大, 古川泰人, 大友寛之, 東山翔平, 大内啓樹. 2023. 場所参照表現と位置情報を紐付けるジオコーディングの概観と発展に向けての考察. 言語処理学会第29回年次大会.
村上聡一朗, 菊田洸, 張培楠, 上垣外英剛, 高村大也, 奥村学. 2023. 原文の書き換えによる広告文生成. 言語処理学会第29回年次大会.
川畑輝, 菅原朔. 2023. 読解問題における論理推論の一貫性評価. 言語処理学会第29回年次大会. 若手奨励賞
大内啓樹, 進藤裕之, 若宮翔子, 松田裕貴, 井之上直也, 東山翔平, 中村哲, 渡辺太郎. 2023. 地球の歩き方旅行記データセット. 言語処理学会第29回年次大会.
大友寛之, 東山翔平, 大内啓樹, 山本和太郎, 井手佑翼, 進藤裕之, 渡辺太郎. 2023. 旅行記中の場所に対する訪問状態の予測. 言語処理学会第29回年次大会.
齋藤玲, 大内啓樹, 羽鳥康裕, 邑本俊亮, 杉浦元亮, 塩入諭, 柴山明寛. 2023. 震災アーカイブと震災アーカイブwebに関する概念モデルの作成. 言語処理学会第29回年次大会.
上垣外英剛, 林克彦, 渡辺太郎. 2023. 視覚と言語の融合モデルにおける知識の振る舞いを調査するための表と画像の生成タスクの提案及びその調査結果. 言語処理学会第29回年次大会. 委員特別賞
大羽未悠, 栗林樹生, 大内啓樹, 渡辺太郎. 2022. 言語モデルの第二言語獲得効率. 自然言語処理研究会. 優秀研究賞
的川雄飛. 2022. /j/, /w/の借用元言語における分類と/CjV/, /CwV/の日本語表記. 思考と言語研究会.
井手佑翼, 出口祥之, 五藤巧, Armin Sarhangzadeh, 渡辺太郎. 2022. 後続文脈の考慮が文法誤り訂正性能にもたらす影響の調査. 自然言語処理研究会.
五藤巧, 永田亮, 三田雅人. 2022. 文法誤り訂正における訂正難易度の判別可能性. 自然言語処理研究会. 若手奨励賞
チェジョンミン, 本多右京, 渡辺太郎, 乾健太郎. 2022. 法律の階層構造を利用した教師あり対照学習による法律検索. 2022年度人工知能学会全国大会（第36回）. 全国大会優秀賞
原田宥都, 渡辺太郎. 2022. 入れ子型固有表現に対する変分情報ボトルネック法の適用. 言語処理学会第28回年次大会.
本多右京, 渡辺太郎, 松本裕治. 2022. 強化学習における画像キャプションの低識別性問題とLong-Tail分類手法を用いた対処. 言語処理学会第28回年次大会. 最優秀賞
芝原隆善, 大内啓樹, 山田育矢, 西田典起, 寺西裕紀, 古崎晃司, 渡辺太郎, 松本裕治. 2022. ユーザの興味があるカテゴリに応じたNER システム構築フレームワーク. 言語処理学会第28回年次大会.
加藤明彦, 近藤修平, 進藤裕之, 渡辺太郎. 2022. 材料科学論文の表の意味解釈データセットの構築. 言語処理学会第28回年次大会.
早川明男, 大内啓樹, 梶原智之, 渡辺太郎. 2022. テキスト平易化における自動評価指標のメタ評価の検討. 言語処理学会第28回年次大会.
澤田悠冶, 小田悠介. 2022. 制約抽出のための対訳コーパスを用いた半教師ありクロスリンガル用語推定. 言語処理学会第28回年次大会.
平野颯, 大内啓樹, 渡辺太郎. 2022. 多言語機械翻訳への言語類型論特徴の導入. 言語処理学会第28回年次大会.
坂井優介, 田口智大, 渡辺太郎. 2022. タタール語におけるサブワード単位の言語識別を加味したキリル文字からラテン文字への翻字システムの開発. 言語処理学会第28回年次大会.
原田慎太朗, 渡辺太郎, 大内啓樹. 2022. 雑音のある通信路モデルを用いた句構造解析. 言語処理学会第28回年次大会.
大友寛之, 大内啓樹, 星野智紀, 井手佑翼, 渡辺太郎. 2022. 訪問場所表現グラウンディングのためのアノテーション. 言語処理学会第28回年次大会.
Chihiro Taguchi. 2021. Mermaid construction in Tatar. 第162回日本言語学会大会.
澤田悠冶, 寺西裕紀, 松本裕治, 渡辺太郎. 2021. 並列構造解析に基づく複合化された固有表現の曖昧性解消. 言語処理学会第27回年次大会.
田口智大, 渡辺太郎. 2021. So-Called “Prepositions” in Somali are Not Prepositions: A Linguistic Approach for Somali POS Tagging. 言語処理学会第27回年次大会.
新妻巧朗, 渡辺太郎. 2021. 文表現の摂動正規化: 事前学習済みモデルのDebias手法. 言語処理学会第27回年次大会.
山口泰弘, 進藤裕之, 渡辺太郎. 2021. ラベルの不均衡を考慮したEnd-to-End情報抽出モデルの学習. 言語処理学会第27回年次大会.
平野颯, 野村航, 進藤裕之, 渡辺太郎. 2021. 遺伝子二重欠失研究のための関連論文検索手法. 言語処理学会第27回年次大会.
廣瀬雄士, 新保仁, 渡辺太郎. 2021. 知識グラフエンベディングのためのリレーションパスルールによるトランスダクティブデータ拡張. 言語処理学会第27回年次大会.
岩田晟, 渡辺太郎, 永田昌明. 2021. 質問応答に基づく日本語ゼロ代名詞同定. 言語処理学会第27回年次大会.
坂井優介, 渡辺太郎, 藤田篤. 2021. 知識グラフ埋め込みを用いたニューラル機械翻訳におけるエンティティ表現の改良. 言語処理学会第27回年次大会.
原田慎太朗, 渡辺太郎. 2021. 教師なし同期的句構造を用いた機械翻訳. 言語処理学会第27回年次大会.
本多右京, 牛久祥孝, 橋本敦史, 渡辺太郎, 松本裕治. 2021. 画像と単語の不一致を考慮した疑似教師ありキャプション生成. 言語処理学会第27回年次大会. 若手奨励賞
芝原隆善, 山田育矢, 西田典起, Shanshan Liu, 古崎晃司, 渡辺太郎, 松本裕治. 2021. 入れ子になっている固有表現に対する Distant Supervision. 言語処理学会第27回年次大会.
佐藤義貴, 和田崇史, 渡辺太郎, 松本裕治. 2020. 英語学習者の母語を考慮した文法誤り訂正のための擬似データ生成. 自然言語処理研究会. 若手奨励賞
山元勇輝, 松本裕治, 渡辺太郎. 2020. AMR複文構文パターン辞書作成および意味的曖昧性解消実験. 自然言語処理研究会.
Chihiro Taguchi. 2020. Raising to quirky subject in Tatar. 第161回日本言語学会大会.

その他(記事・講演)

二宮崇, 出口祥之, 内山将夫, 田村晃裕, 隅田英一郎. 2021. ニューラル機械翻訳のためのバイリンガルサブワード分割の研究. Japio YEAR BOOK 2021.
渡辺太郎. 2020. 書評: Neural Machine Translation by Philipp Koehn. AAMTジャーナル「機械翻訳」.

発表文献

ジャーナル論文

国際会議

ワークショップ

国内会議・研究会

その他(記事・講演)