Journal papers

Mana Makinae, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2026. Rethinking Evaluation in Simultaneous Speech Translation: A Case for Monotonic Test Sets. Computational Linguistics (to appear).
Takumi Goto, Yusuke Sakai and Taro Watanabe. 2026. Grammatical Error Correction Evaluation by Optimally Transporting Edit Representation. Transactions of the Association for Computational Linguistics (to appear).
Yusuke Sakai, Zhi Qu, Hidetaka Kamigaito, Taro Watanabe and Xiaojiang Liu. 2026. Domain Translation with Monolingual Lexical Distribution. Transactions on Machine Learning Research.
Yuki Yamamoto, Taro Watanabe and Yuji Matsumoto. 2026. Syntactic Disambiguation of Complex Sentences via Forest Reranking. Journal of Natural Language Processing (to appear).
Takumi Goto, Justin Vasselli adn Taro Watanabe. 2026. Improving Explainability of Sentence-level Metrics via Edit-level Attribution for Grammatical Error Correction. Journal of Natural Language Processing (to appear).
Miyu Oba, Yohei Oseki, Akiyo Fukatsu, Akari Haga, Hiroki Ouchi, Taro Watanabe and Saku Sugawara. 2026. Inducing Grammatical Knowledge from Indirect Evidence in Language Models. Journal of Natural Language Processing (to appear).
Yusuke Ide, Yuto Nishida, Justin Vasselli, Miyu Oba, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2026. Rethinking the Evaluation Methods of LLMs’ Grammatical Knowledge. Journal of Natural Language Processing (to appear).
Xincan Feng, Hejie Cui, Kazuki Hayashi, Huy Hien Vu, Kenta T. Suzuki, Noriki Nishida, Hidetaka Kamigaito, Yuji Matsumoto, Taro Watanabe and Carl Yang. 2025. LLMKG＋: Systematically improving knowledge quality and coverage in KGs using LLMs – A case study in medical domain. AI Open.
Yuto Nishida, Makoto Morishita, Hiroyuki Deguchi, Hidetaka Kamigaito and Taro Watanabe. 2025. Long-Tail Crisis in Nearest Neighbor Language Models. Journal of Natural Language Processing.
Adam Nohejl, Akio Hayakawa, Yusuke Ide and Taro Watanabe. 2025. A Japanese Dataset and Efficient Multilingual LLM-Based Methods for Lexical Simplification and Lexical Complexity Prediction. Journal of Natural Language Processing.
Ayuki Katayama, Shohei Higashiyama, Hiroki Ouchi, Yusuke Sakai, Ayano Takeuchi, Ryo Bando, Yuta Hashimoto, Toshinobu Ogiso and Taro Watanabe. 2025. Cross-Era Evaluation of Language Models for Location Referring Expression Extraction. Journal of Natural Language Processing.
Wataru Hashimoto, Hidetaka Kamigaito and Taro Watanabe. 2025. Uncertainty Estimation through Data Augmentation in Named Entity Recognition. Journal of Natural Language Processing.
Haruki Sakajo, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. Vowel Articulation and Tongue Position in Language Models. Journal of Natural Language Processing.
Huayang Li, Deng Cai, Zhi Qu, Qu Cui, Hidetaka Kamigaito, Lemao Liu and Taro Watanabe. 2025. Cross-lingual Contextualized Phrase Retrieval. Journal of Natural Language Processing.
Masao Ideuchi, Yoshiaki Oida, Shohei Higashiyama, Hideki Tanaka, Masao Utiyama and Taro Watanabe. 2025. Component Recommend System for Enterprise Resource Planning Package by Reranking using Large Language Models. Journal of Natural Language Processing.
Kosuke Doi, Katsuhito Sudoh, Satoshi Nakamura and Taro Watanabe. 2025. Enhancing Automated Essay Scoring with Grammatical Features using Multi-task Learning and Item Response Theory. Journal of Natural Language Processing.
Tatsuya Aoki, Jey Han Lau, Hidetaka Kamigaito, Hiroya Takamura, Timothy Baldwin and Manabu Okumura. 2025. Discovering Unusual Word Usages with Masked Language Model via Pseudo-label Training. Journal of Natural Language Processing.
Zhiyu Guo, Hidetaka Kamigaito and Taro Watanabe. 2025. Dependency-Aware Semi-Structured Sparsity of GLU Variants in Large Language Models. Transactions on Machine Learning Research.
Yusuke Sakai, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2024. Investigation of the Inference Capabilities and Memorization of Pre-trained Language Models. Journal of Natural Language Processing. Paper Award
Yuya Sawada, Yuichiro Yasui, Hiroki Ouchi, Taro Watanabe, Masayuki Ishii, Shotaro Ishihara, Takeshi Yamada and Hiroyuki Shindo. 2024. Constraction and Analysis of Similarity-based EL System for Nikkei Company ID Linking. Journal of Natural Language Processing.
Kosuke Doi, Katsuhito Sudoh and Satoshi Nakamura. 2024. NAIST Simultaneous Interpretation Corpus: Development and Analyses of Data from Interpreters of Different Levels. Journal of Natural Language Processing.
Huy Hien Vu, Hidetaka Kamigaito and Taro Watanabe. 2024. Context-Aware Machine Translation with Source Coreference Explanation. Transactions of the Association for Computational Linguistics.
Miyu Oba, Tatsuki Kuribayashi, Hiroki Ouchi and Taro Watanabe. 2024. Second Language Acquisition of Neural Language Models. Journal of Natural Language Processing. Paper Award
Hiroyuki Deguchi, Taro Watanabe, Yusuke Matsui, Masao Utiyama, Hideki Tanaka and Eiichiro Sumita. 2024. Subset Retrieval Nearest Neighbor Machine Translation. Journal of Natural Language Processing.
Jungmin Choi, Ukyo Honda, Taro Watanabe and Kentaro Inui. 2023. Explainable Natural Language Inference in the Legal Domain via Text Generation. Transactions of the Japanese Society for Artificial Intelligence.
Van-Hien Tran, Hiroki Ouchi, Hiroyuki Shindo, Yuji Matsumoto and Taro Watanabe. 2023. Enhancing Semantic Correlation between Instances and Relations for Zero-Shot Relation Extraction. Journal of Natural Language Processing.
Shintaro Harada and Taro Watanabe. 2022. Neural Machine Translation with Synchronous Latent Phrase Structure. Journal of Natural Language Processing.
Yuki Yamamoto, Yuji Matsumoto and Taro Watanabe. 2022. Dependency Patterns of Complex Sentences and Semantic Disambiguation for Abstract Meaning Representation Parsing. Journal of Natural Language Processing.
Ukyo Honda, Hashimoto Atsushi, Taro Watanabe and Yuji Matsumoto. 2022. Removing Partial Mismatches in Unsupervised Image Captioning. Transactions of the Japanese Society for Artificial Intelligence.
Yiran Wang, Hiroyuki Shindo, Yuji Matsumoto, and Taro Watanabe. 2022. Nested Named Entity Recognition via Explicitly Excluding the Influence of the Best Path. Journal of Natural Language Processing.
Hiroki Ouchi, Jun Suzuki, Sosuke Kobayashi, Sho Yokoi, Tatsuki Kuribayashi, Masashi Yoshikawa and Kentaro Inui. 2021. Instance-Based Neural Dependency Parsing. Transactions of the Association for Computational Linguistics.
Farjana Sultana Mim, Naoya Inoue, Paul Reisert, Hiroki Ouchi and Kentaro Inui. 2021. Corruption Is Not All Bad: Incorporating Discourse Structure Into Pre-Training via Corruption for Essay Scoring. IEEE/ACM Transactions on Audio, Speech, and Language Processing.
Yuya Sawada, Hiroki Teranishi, Yuji Matsumoto and Taro Watanabe. 2021. Coordinate Structure Analysis without Labeled Data for Recognizing Compound Named Entities. Journal of Natural Language Processing.
Van-Hien Tran, Van-Thuy Phi, Akihiko Kato, Hiroyuki Shindo, Taro Watanabe and Yuji Matsumoto. 2021. Improved Decomposition Strategy for Joint Entity and Relation Extraction. Journal of Natural Language Processing.
Masao Ideuchi, Yohei Sakamoto, Yoshitaka Oida, Isaac Okada, Shohei Higashiyama, Masao Utiyama, Eiichiro Sumita and Taro Watanabe. 2021. A Selection Support System for Enterprise Resource Planning Package Components using Ensembles of Multiple Models with Round-trip Translation. Journal of Natural Language Processing.
Hiroyuki Deguchi, Masao Utiyama, Akihiro Tamura, Takashi Ninomiya and Eiichiro Sumita. 2021. Bilingual Subword Segmentation for Neural Machine Translation. Journal of Natural Language Processing.
Hiroki Teranishi, Hiroyuki Shindo, Taro Watanabe and Yuji Matsumoto. 2020. Coordinate Structure Analysis using Local Models and CKY Algorithm. Journal of Natural Language Processing.
Shohei Higashiyama, Masao Utiyama, Yuji Matsumoto, Taro Watanabe and Eiichiro Sumita. 2020. Auxiliary Lexicon Word Prediction for Cross-Domain Word Segmentation. Journal of Natural Language Processing.
Shohei Higashiyama, Masao Utiyama, Eiichiro Sumita, Masao Ideuchi, Yoshiaki Oida, Yohei Sakamoto, Isaac Okada and Yuji Matsumoto. 2020. Character-to-Word Attention for Word Segmentation. Journal of Natural Language Processing. Paper Award

International conferences

Kazuki Hayashi, Shintaro Ozaki, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2026. Diagnosing Vision Language Models’ Perception by Leveraging Human Methods for Color Vision Deficiencies. EACL 2026.
Xuefeng Wei, Xuan Zhou, Yusuke Sakai and Taro Watanabe. 2026. `Yuki Gets Sushi, David Gets Steak?’’: Uncovering Gender and Racial Biases in LLM-Based Meal Recommendations. EACL 2026.
Tomoyuki Jinno, Kazuki Hayashi, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2026. Cosine Similarity as Logits?: A Scalable Knowledge Probe Using Embedding Vectors from Generative Language Models. EACL 2026.
Ye Xiong, Hidetaka Kamigaito, Soichiro Murakami, Peinan Zhang, Hiroya Takamura and Manabu Okumura. 2026. Progressive Visual Refinement for Multi-modal Summarization. EACL 2026.
Hiroyuki Deguchi; Katsuki Chousa; Yusuke Sakai. 2026. Hacking Neural Evaluation Metrics with a Single Text. EACL 2026.
Justin Vasselli, Arturo MP, Frederikus Hudi, Haruki Sakajo and Taro Watanabe. 2026. Measuring Linguistic Competence of LLMs on Indigenous Languages of the Americas. EACL 2026.
Zhe Cao, Yusuke Oda, Qianying Liu, Akiko Aizawa and Taro Watanabe. 2026. Completely Modular Fine-tuning for Dynamic Language Adaptation. EACL 2026 Findings.
Juseon Do, Sungwoo Han, Jingun Kwon, Hidetaka Kamigaito and Manabu Okumura. 2026. ConRAS: Contrastive In-context Learning Framework for Retrieval-Augmented Summarization. EACL 2026 Findings.
Juseon Do, Sungwoo Han, Jingun Kwon, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2026. Beyond Sampling: Self-Sorting for Long-Context Ranking. EACL 2026 Findings.
Tsuyoshi Fujita, Yuya Sawada, Yusuke Sakai and Taro Watanabe. 2026. Toward Automatic Delegation Extraction in Japanese Law. EACL 2026 Industry.
Yuya Sawada, Tsuyoshi Fujita, Yusuke Sakai and Taro Watanabe. 2026. entity-linkings: A Unified Library for Entity Linking. EACL 2026 System Demonstrations.
Koki Natsumi, Hiroyuki Deguchi, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. Agreement-Constrained Probabilistic Minimum Bayes Risk Decoding. IJCNLP-AACL 2025.
Mana Makinae, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. Investigating Omission as a Latency Reduction Strategy in Simultaneous Speech Translation. IJCNLP-AACL 2025 Findings.
Jesse Atuhurra, Hidetaka Kamigaito, Taro Watanabe and Koichiro Yoshino. 2025. J-ORA: A Multimodal Framework and Dataset for Japanese Object Identification, Reference, Action Prediction in Robot Perception. 2025 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS).
Ryo Hasegawa, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. Knowledge Editing Induces Underconfidence in Language Models. *SEM 2025.
Chihiro Taguchi, Seng Mai, Keita Kurabe, Yusuke Sakai, Georgina Agyei, Soudabeh Eslami and David Chiang. 2025. Languages Still Left Behind: Toward a Better Multilingual Machine Translation Benchmark. EMNLP 2025.
Justin Vasselli, Eunike Andriani Kardinata, Yusuke Sakai and Taro Watanabe. 2025. Multilingual Dialogue Generation and Localization with Dialogue Act Scripting. EMNLP 2025.
Ashmari Pramodya, Nirasha Nelki, Heshan Shalinda, Chamila Liyanage, Yusuke Sakai, Randil Pushpananda, Ruvan Weerasinghe, Hidetaka Kamigaito and Taro Watanabe. 2025. SinhalaMMLU: A Comprehensive Benchmark for Evaluating Multitask Language Understanding in Sinhala. EMNLP 2025.
Hongyu Sun, Yusuke Sakai, Haruki Sakajo, Shintaro Ozaki, Kazuki Hayashi, Hidetaka Kamigaito and Taro Watanabe. 2025. LoCt-Instruct: An Automatic Pipeline for Constructing Datasets of Logical Continuous Instructions. EMNLP 2025.
Wataru Hashimoto, Hidetaka Kamigaito and Taro Watanabe. 2025. Decoding Uncertainty: The Impact of Decoding Strategies for Uncertainty Estimation in Large Language Models. EMNLP 2025 Findings.
Sangjun Moon, Dasom choi, Jingun Kwon, Hidetaka Kamigaito, Manabu Okumura. 2025. Length Representations in Large Language Models. EMNLP 2025 Findings.
Hiroto Otake, Peinan Zhang, Yusuke Sakai, Masato Mita, Hiroki Ouchi and Taro Watanabe. 2025. BannerBench: Benchmarking Vision Language Models for Multi-Ad Selection with Human Preferences. EMNLP 2025 Findings.
Takumi Goto, Yusuke Sakai and Taro Watanabe. 2025. Reliability Crisis of Reference-free Metrics for Grammatical Error Correction. EMNLP 2025 Findings.
Yuya Sawada, Hiroki Ouchi, Yuichiro Yasui, Hiroki Teranishi, Yuji Matsumoto, Taro Watanabe and Masayuki Ishii. 2025. JaCorpTrack: Corporate History Event Extraction for Tracking Organizational Changes. EMNLP 2025 Industry.
Kazuki Hayashi, Hidetaka Kamigaito, Shinya Kouda and Taro Watanabe. 2025. IterKey: Iterative Keyword Generation with LLMs for Enhanced Retrieval Augmented Generation. Conference on Language Modeling (COLM 2025).
Boxuan Lyu, Hidetaka Kamigaito, Kotaro Funakoshi and Manabu Okumura. 2025. Unveiling the Power of Source: Source-based Minimum Bayes Risk Decoding for Neural Machine Translation. ACL 2025.
Aitaro Yamamoto, Hiroyuki Otomo, Hiroki Ouchi, Shohei Higashiyama, Hiroki Teranishi, Hiroyuki Shindo and Taro Watanabe. 2025. Graph-Structured Trajectory Extraction from Travelogues. ACL 2025.
Zhi Qu, Yiran Wang, Jiannan Mao, Chenchen Ding, Hideki Tanaka, Masao Utiyama and Taro Watanabe. 2025. Registering Source Tokens to Target Language Spaces in Multilingual Neural Machine Translation. ACL 2025.
Yusuke Ide, Joshua Tanner, Adam Nohejl, Jacob Hoffman, Justin Vasselli, Hidetaka Kamigaito and Taro Watanabe. 2025. CoAM: Corpus of All-Type Multiword Expressions. ACL 2025.
Hidetaka Kamigaito, Hiroyuki Deguchi, Yusuke Sakai, Katsuhiko Hayashi and Taro Watanabe. 2025. Diversity Explains Inference Scaling Laws: Through a Case Study of Minimum Bayes Risk Decoding. ACL 2025.
Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. Revisiting Compositional Generalization Capability of Large Language Models Considering Instruction Following Ability. ACL 2025. Outstanding Paper Award
Shintaro Ozaki, Kazuki Hayashi, Miyu Oba, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. BQA: Body Language Question Answering Dataset for Video Large Language Models. ACL 2025.
Takumi Goto, Yusuke Sakai and Taro Watanabe. 2025. Rethinking Evaluation Metrics for Grammatical Error Correction: Why Use a Different Evaluation Process than Human?. ACL 2025.
Soichiro Murakami, Peinan Zhang, Hidetaka Kamigaito, Hiroya Takamura and Manabu Okumura. 2025. AdParaphrase v2.0: Generating Attractive Ad Texts Using a Preference-Annotated Paraphrase Dataset. ACL 2025 Findings.
Yusuke Sakai, Takumi Goto and Taro Watanabe. 2025. IMPARA-GED: Grammatical Error Detection is Boosting Reference-free Grammatical Error Quality Estimator. ACL 2025 Findings.
Haruki Sakajo, Yusuke Ide, Justin Vasselli, Yusuke Sakai, Yingtao Tian, Hidetaka Kamigaito and Taro Watanabe. 2025. Dictionaries to the Rescue: Cross-Lingual Vocabulary Transfer for Low-Resource Languages Using Bilingual Dictionaries. ACL 2025 Findings.
Takumi Goto, Yusuke Sakai, and Taro Watanabe. 2025. gec-metrics: A Unified Library for Grammatical Error Correction Evaluation. ACL 2025 System Demonstrations.
Zhi Qu, Chenchen Ding and Taro Watanabe. 2025. Languages Transferred Within the Encoder: On Representation Transfer in Zero-Shot Multilingual Translation. MT Summit 2025. Best Paper Award
Genta Indra Winata, Frederikus Hudi, Patrick Amadeus Irawan, David Anugraha, Rifki Afina Putri, WANG YUTONG, Adam Nohejl, Ubaidillah Ariq Prathama, Nedjma Ousidhoum, Afifa Amriani, Anar Sabuhi Rzayev, Anirban Das, Ashmari Pramodya, Aulia Adila, Bryan Wilie, Candy Olivia Mawalim, CHENG Ching Lam, Daud Abolade, Emmanuele Chersoni, Enrico Santus, Fariz Ikhwantri, Garry Kuwanto, Hanyang Zhao, Haryo Akbarianto Wibowo, Holy Lovenia, Jan Christian Blaise Cruz, Jan Wira Gotama Putra, Junho Myung, Lucky Susanto, Maria Angelica Riera Machin, Marina Zhukova, Michael Anugraha, Muhammad Farid Adilazuarda, Natasha Christabelle Santosa, Peerat Limkonchotiwat, Raj Dabre, Rio Alexander Audino, Samuel Cahyawijaya, Shi-Xiong Zhang, Stephanie Yulia Salim, Yi Zhou, Yinxuan Gui, David Ifeoluwa Adelani, En-Shiun Annie Lee, Shogo Okada, Ayu Purwarianti, Alham Fikri Aji, Taro Watanabe, Derry Tanti Wijaya, Alice Oh and Chong-Wah Ngo. 2025. WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines. NAACL 2025. Best Theme Paper Award
Yusuke Ide, Yuto Nishida, Justin Vasselli, Miyu Oba, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. How to Make the Most of LLMs’ Grammatical Knowledge for Acceptability Judgments. NAACL 2025.
Peinan Zhang, Yusuke Sakai, Masato Mita, Hiroki Ouchi and Taro Watanabe. 2025. AdTEC: A Unified Benchmark for Evaluating Text Quality in Search Engine Advertising. NAACL 2025.
Haruki Sakajo, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. Tonguescape: Exploring Language Models Understanding of Vowel Articulation. NAACL 2025.
Eri Onami, Taiki Miyanishi, Koki Maeda and Shuhei Kurita. 2025. LegalViz: Legal Text Visualization by Text To Diagram Generation. NAACL 2025.
Shintaro Ozaki, Kazuki Hayashi, Yusuke Sakai, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2025. Towards Cross-Lingual Explanation of Artwork in Large-scale Vision Language Models. NAACL 2025 Findings.
Wataru Hashimoto, Hidetaka Kamigaito and Taro Watanabe. 2025. Efficient Nearest Neighbor based Uncertainty Estimation for Natural Language Processing Tasks. NAACL 2025 Findings.
Yuto Nishida, Makoto Morishita, Hiroyuki Deguchi, Hidetaka Kamigaito and Taro Watanabe. 2025. Long-Tail Crisis in Nearest Neighbor Language Models. NAACL 2025 Findings.
Soichiro Murakami, Peinan Zhang, Hidetaka Kamigaito, Hiroya Takamura and Manabu Okumura. 2025. AdParaphrase: Paraphrase Dataset for Analyzing Linguistic Features toward Generating Attractive Ad Texts. NAACL 2025 Findings.
Juseon-Do, Jaesung Hwang, Jingun Kwon, Hidetaka Kamigaito and Manabu Okumura. 2025. Considering Length Diversity in Retrieval-Augmented Summarization. NAACL 2025 Findings.
Hiroyuki Deguchi, Go Kamoda, Yusuke Matsushita, Chihiro Taguchi, Kohei Suenaga, Masaki Waga and Sho Yokoi. 2025. A Soft and Fast Pattern Matcher for Billion-Scale Corpus Searches. ICLR 2025.
Justin Vasselli, Adam Nohejl and Taro Watanabe. 2025. Measuring the Robustness of Reference-Free Dialogue Evaluation Systems. COLING 2025.
Hibiki Nakatani, Hiroki Teranishi, Shohei Higashiyama, Yuya Sawada, Hiroki Ouchi and Taro Watanabe. 2025. A Text Embedding Model with Contrastive Example Mining for Point-of-Interest Geocoding. COLING 2025.
Adam Nohejl, Frederikus Hudi, Eunike Andriani Kardinata, Shintaro Ozaki, Maria Angelica Riera Machin, Hongyu Sun, Justin Vasselli and Taro Watanabe. 2025. Beyond Film Subtitles: Is YouTube the Best Approximation of Spoken Vocabulary?. COLING 2025.
Takumi Goto, Hiroyoshi Nagao and Yuta Koreeda. 2025. Acquiring Bidirectionality via Large and Small Language Models. COLING 2025.
Iqra Ali, Jesse Atuhurra, Hidetaka Kamigaito and Taro Watanabe. 2025. HLU: Human Vs LLM Generated Text Detection Dataset for Urdu at Multiple Granularities. COLING 2025.
Katsuki Chousa and Tsutomu Hirao. 2025. Automatic Evaluation of Language Generation Technology Based on Structure Alignment. COLING 2025.
Kazuki Hayashi, Kazuma Onishi, Toma Suzuki, Yusuke Ide, Seiji Gobara, Shigeki Saito, Yusuke Sakai, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2025. IRR: Image Review Ranking Framework for Evaluating Vision-Language Models. COLING 2025.
Seiji Gobara, Hidetaka Kamigaito and Taro Watanabe. 2024. Do LLMs Implicitly Determine the Suitable Text Difficulty for Users?. PACLIC 38.
Hiroyuki Deguchi, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2024. mbrs: A Library for Minimum Bayes Risk Decoding. EMNLP 2024 System Demonstration.
Wataru Hashimoto, Hidetaka Kamigaito and Taro Watanabe. 2024. Are Data Augmentation Methods in Named Entity Recognition Applicable for Uncertainty Estimation?. EMNLP 2024.
Miyu Oba, Yohei Oseki, Akiyo Fukatsu, Akari Haga, Hiroki Ouchi, Taro Watanabe and Saku Sugawara. 2024. Can Language Models Induce Grammatical Knowledge from Indirect Evidence?. EMNLP 2024.
Zhe Cao, Zhi Qu, Hidetaka Kamigaito and Taro Watanabe. 2024. Exploring Intrinsic Language-specific Subspaces in Fine-tuning Multilingual Neural Machine Translation. EMNLP 2024.
Zhiyu Guo, Hidetaka Kamigaito and Taro Watanabe. 2024. Attention Score is not All You Need for Token Importance Indicator in KV Cache Reduction: Value Also Matters. EMNLP 2024.
Mana Makinae, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2024. Simul-MuST-C: Simultaneous Multilingual Speech Translation Corpus Using Large Language Model. EMNLP 2024.
Yusuke Sakai, Mana Makinae, Hidetaka Kamigaito and Taro Watanabe. 2024. Simultaneous Interpretation Corpus Construction by Large Language Models in Distant Language Pair. EMNLP 2024.
Huayang Li, Deng Cai, Zhi Qu, Qu Cui, Hidetaka Kamigaito, Lemao Liu and Taro Watanabe. 2024. Cross-lingual Contextualized Phrase Retrieval. EMNLP 2024 Findings.
Tsutomu Hirao, Naoki Kobayashi, Hidetaka Kamigaito, Manabu Okumura ande Akisato Kimura. 2024. Video Discourse Parsing and Its Application to Multimodal Summarization: A Dataset and Baseline Approaches. EMNLP 2024 Findings.
Kazuki Hayashi, Yusuke Sakai, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2024. Artwork Explanation in Large-scale Vision Language Models. ACL 2024.
Armin Sarhangzadeh and Taro Watanabe. 2024. Alignment-Based Decoding Policy for Low-Latency and Anticipation-Free Neural Japanese Input Method Editors. ACL 2024 Findings.
Juseon-Do Juseon-Do, Jingun Kwon, Hidetaka Kamigaito and Manabu Okumura. 2024. InstructCMP: Length Control in Sentence Compression through Instruction-based Large Language Models. ACL 2024 Findings.
Huayang Li, Siheng Li, Deng Cai, Longyue Wang, Lemao Liu, Taro Watanabe, Yujiu Yang and Shuming Shi. 2024. TextBind: Multi-turn Interleaved Multimodal Instruction-following in the Wild. ACL 2024 Findings.
Hiroyuki Deguchi, Yusuke Sakai, Hidetaka Kamigaito, Taro Watanabe, Hideki Tanaka and Masao Utiyama. 2024. Centroid-Based Efficient Minimum Bayes Risk Decoding. ACL 2024 Findings.
Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2024. mCSQA: Multilingual Commonsense Reasoning Dataset with Unified Creation Strategy by Language Models and Humans. ACL 2024 Findings.
Akari Haga, Saku Sugawara, Akiyo Fukatsu, Miyu Oba, Hiroki Ouchi, Taro Watanabe and Yohei Oseki. 2024. Modeling Overregularization in Children with Small Language Models. ACL 2024 Findings.
Hiroyuki Deguchi, Masaaki Nagata and Taro Watanabe. 2024. Detector-Corrector: Edit-Based Automatic Post Editing for Human Post Editing. EAMT 2024.
Yusuke Sakai, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2024. Does Pre-trained Language Model Actually Infer Unseen Links in Knowledge Graph Completion?. NAACL 2024.
Benjamin Hsu, Xiaoyu Liu, Huayang Li, Yoshinari Fujinuma, Maria Nadejde, Xing Niu, Ron Litman, Yair Kittenplon and Raghavendra Pappagari. 2024. M3T: A New Benchmark Dataset for Multi-Modal Document-Level Machine Translation. NAACL 2024.
Eunike Kardinata, Hiroki Ouchi and Taro Watanabe. 2024. Constructing Indonesian-English Travelogue Dataset. LREC-COLING 2024.
Frederikus Hudi, Zhi Qu, Hidetaka Kamigaito and Taro Watanabe. 2024. Disentangling Pretrained Representation to Leverage Low-Resource Languages in Multilingual Machine Translation. LREC-COLING 2024.
Iqra Ali, Hidetaka Kamigaito and Taro Watanabe. 2024. Monolingual Paraphrase Detection Corpus for Low Resource Pashto Language at Sentence Level. LREC-COLING 2024.
Eri Onami, Shuhei Kurita, Taiki Miyanishi and Taro Watanabe. 2024. JDocQA: Japanese Document Question Answering Dataset for Generative Language Models. LREC-COLING 2024.
Xincan Feng and Akifumi Yoshimoto. 2024. Llama-VITS: Enhancing TTS Synthesis with Semantic Awareness. LREC-COLING 2024.
Shohei Higashiyama, Hiroki Ouchi, Hiroki Teranishi, Hiroyuki Otomo, Yusuke Ide, Aitaro Yamamoto, Hiroyuki Shindo, Yuki Matsuda, Shoko Wakamiya, Naoya Inoue, Ikuya Yamada and Taro Watanabe. 2024. Arukikata Travelogue Dataset with Geographic Entity Mention, Coreference, and Link Annotation. EACL 2024 Findings.
Hiroyuki Deguchi, Kenji Imamura, Yuto Nishida, Yusuke Sakai, Justin Vasselli and Taro Watanabe. 2023. NAIST-NICT WMT’23 General MT Task Submission. WMT 2023.
Lemao Liu, Francisco Casacuberta, George Foster, Guoping Huang, Philipp Koehn, Geza Kovacs, Shuming Shi, Taro Watanabe and Chengqing Zong. 2023. Findings of the Word-Level AutoCompletion Shared Task in WMT 2023. WMT 2023.
Huayang Li, Tian Lan, Zihao Fu, Deng Cai, Lemao Liu, Nigel Collier, Taro Watanabe and Yixuan Su. 2023. Repetition In Repetition Out: Towards Understanding Neural Text Degeneration from the Data Perspective. NeurIPS 2023.
Yiran Wang, Taro Watanabe, Masao Utiyama and Yuji Matsumoto. 2023. 24-bit Languages. IJCNLP-AACL 2023.
Xincan Feng, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2023. Model-based Subsampling for Knowledge Graph Completion. IJCNLP-AACL 2023.
Shuhei Kurita, Naoki Katsura and Eri Onami. 2023. RefEgo: Referring Expression Comprehension Dataset from First-Person Perception of Ego4D. ICCV 2023.
Chihiro Taguchi, Yusuke Sakai, Parisa Haghani and David Chiang. 2023. Universal Automatic Phonetic Transcription into the International Phonetic Alphabet. Interspeech 2023.
Hiroyuki Deguchi, Taro Watanabe, Yusuke Matsui, Masao Utiyama, Hideki Tanaka and Eiichiro Sumita. 2023. Subset Retrieval Nearest Neighbor Machine Translation. ACL 2023.
Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2023. Table and Image Generation for Investigating Knowledge of Entities in Pretrained Vision and Language Models. ACL 2023.
Ying Zhang, Hidetaka Kamigaito and Manabu Okumura. 2023. Bidirectional Transformer Reranker for Grammatical Error Correction. ACL 2023 Findings.
Miyu Oba, Tatsuki Kuribayashi, Hiroki Ouchi and Taro Watanabe. 2023. Second Language Acquisition of Neural Language Models. ACL 2023 Findings.
Aru Maekawa, Hidetaka Kamigaito, Kotaro Funakoshi and Manabu Okumura. 2023. Generative Replay Inspired by Hippocampal Memory Indexing for Continual Language Learning. EACL 2023.
Jingun Kwon, Hidetaka Kamigaito, Young-In Song and Manabu Okumura. 2023. Hierarchical Label Generation for Text Classification.
Jingun Kwon, Hidetaka Kamigaito and Manabu Okumura. 2023. Abstractive Document Summarization with Summary-length Prediction. EACL 2023 Findings.
Ukyo Honda, Taro Watanabe and Yuji Matsumoto. 2023. Switching to Discriminative Image Captioning by Relieving a Bottleneck of Reinforcement Learning. WACV 2023.
Francisco Casacuberta, George Foster, Guoping Huang, Philipp Koehn, Geza Kovacs, Lemao Liu, Shuming Shi, Taro Watanabe and Chengqing Zong. 2022. Findings of the Word-Level AutoCompletion Shared Task in WMT 2022. WMT 2022.
Hiroyuki Deguchi, Kenji Imamura, Masahiro Kaneko, Yuto Nishida, Yusuke Sakai, Justin Vasselli, Huy Hien Vu and Taro Watanabe. 2022. NAIST-NICT-TIT WMT22 General MT Task Submission. WMT 2022.
Huayang Li, Deng Cai, Jin Xu and Taro Watanabe. 2022. N-gram Is Back: Residual Learning of Neural Text Generation with n-gram Language Model. EMNLP 2022 Findings.
Jungmin Choi, Ukyo Honda, Taro Watanabe, Hiroki Ouchi and Kentaro Inui. 2022. Law retrieval with supervised contrastive learning using the hierarchical structure of law. PACLIC 36.
Shuhei Kurita, Hiroki Ouchi, Kentaro Inui and Satoshi Sekine. 2022. Iterative Span Selection: Self-Emergence of Resolving Orders in Semantic Role Labeling. COLING 2022.
Zhi Qu and Taro Watanabe. 2022. Adapting to Non-Centered Languages for Zero-shot Multilingual Translation. COLING 2022.
Shiki Sato, Reina Akama, Hiroki Ouchi, Ryoko Tokuhisa, Jun Suzuki and Kentaro Inui. 2022. N-best Response-based Analysis of Contradiction-awareness in Neural Response Generation Models. SIGDIAL 2022.
Masao Ideuchi, Masatoshi Tsuchiya, Yiran Wang and Masao Utiyama. 2022. NICTmed at the NCTIR-16 Real-MedNLP Task. NTCIR-16.
Hidetaka Kamigaito and Katsuhiko Hayashi. 2022. Comprehensive Analysis of Negative Sampling in Knowledge Graph Representation Learning. ICML 2022.
Jiannan Xiang, Huayang Li, Defu Lian, Guoping Huang, Taro Watanabe and Lemao Liu. 2022. Visualizing the Relationship Between Encoded Linguistic Information and Task Performance. ACL 2022 Findings.
Zuchao Li, Yiran Wang, Masao Utiyama, Eiichiro Sumita, Hai Zhao and Taro Watanabe. 2022. What Works and Doesn’t Work, A Deep Decoder for Neural Machine Translation. ACL 2022 Findings.
Yushi Hirose, Masashi Shimbo and Taro Watanabe. 2021. Transductive Data Augmentation with Relational Path Rule Mining for Knowledge Graph Embedding. 2021 IEEE International Conference on Big Knowledge (ICBK).
Yuki Yamamoto, Yuji Matsumoto and Taro Watanabe. 2021. Dependency Patterns of Complex Sentences and Semantic Disambiguation for Abstract Meaning Representation Parsing. *SEM 2021.
Yiran Wang, Hiroyuki Shindo, Yuji Matsumoto and Taro Watanabe. 2021. Nested Named Entity Recognition via Explicitly Excluding the Influence of the Best Path. ACL-IJCNLP 2021.
Wei Bi, Huayang Li and Jiacheng Huang. 2021. Data Augmentation for Text Generation Without Any Augmented Data. ACL-IJCNLP 2021.
Deng Cai, Yan Wang, Huayang Li, Wai Lam and Lemao Liu. 2021. Neural Machine Translation with Monolingual Translation Memory. ACL-IJCNLP 2021.
Huayang Li, Lemao Liu, Guoping Huang and Shuming Shi. 2021. GWLAN: General Word-Level AutocompletioN for Computer-Aided Translation. ACL-IJCNLP 2021.
Yiran Wang, Hiroyuki Shindo, Yuji Matsumoto and Taro Watanabe. 2021. Structured Refinement for Sequential Labeling. ACL-IJCNLP 2021 Findings.
Jiannan Xiang, Yahui Liu, Deng Cai, Huayang Li, Defu Lian and Lemao Liu. 2021. Assessing Dialogue Systems with Distribution Distances. ACL-IJCNLP 2021 Findings.
Shohei Higashiyama, Masao Utiyama, Taro Watanabe and Eiichiro Sumita. 2021. User-Generated Text Corpus for Evaluating Japanese Morphological Analysis and Lexical Normalization. NAACL-HLT 2021.
Ukyo Honda, Yoshitaka Ushiku, Atsushi Hashimoto, Taro Watanabe and Yuji Matsumoto. 2021. Removing Word-Level Spurious Alignment between Images and Pseudo-Captions in Unsupervised Image Captioning. EACL 2021.
Vu Tran, Van-Hien Tran, Phuong Minh Nguyen, Chau Minh Nguyen, Ken Satoh, Yuji Matsumoto and Minh Le Nguyen. 2021. CovRelex: A COVID-19 Retrieval System with Relation Extraction. EACL 2021: Demo Track.
Yuya Sawada, Takashi Wada, Takayoshi Shibahara, Hiroki Teranishi, Shuhei Kondo, Hiroyuki Shindo, Taro Watanabe and Yuji Matsumoto. 2020. Coordination Boundary Identification without Labeled Data for Compound Terms Disambiguation. COLING 2020.
Ikuya Yamada, Akari Asai, Hiroyuki Shindo, Hideaki Takeda and Yuji Matsumoto. 2020. LUKE: Deep Contextualized Entity Representations with Entity-aware Self-attention. EMNLP 2020.

Workshops

Liu Hanze, Yusuke Sakai and Taro Watanabe. 2026. Towards Singable Lyrics Translation Using Large Language Models. EACL Student Research Workshop (SRW) 2026.
Haruki Sakajo, Hiroshi Takato, Hiroshi Tsutsui, Komei Soda, Hidetaka Kamigaito and Taro Watanabe. 2025. Toward Automatic Safe Driving Instruction: A Large-Scale Vision Language Model Approach. MMLoSo Workshop 2025: Multimodal Models for Low-Resource Contexts and Social Impact.
Zhi Qu, Yiran Wang, Chenchen Ding, Hideki Tanaka, Masao Utiyama and Taro Watanabe. 2025. Improving Language Transfer Capability of Decoder-only Architecture in Multilingual Neural Machine Translation. MRL Workshp 2025.
Ashmari Pramodya, Yusuke Sakai, Justin Vasselli, Hidetaka Kamigaito and Taro Watanabe. 2025. Translating Movie Subtitles by Large Language Models using Movie-meta Information. ACL Student Research Workshop (SRW) 2025.
Takumi Goto, Justin Vasselli and Taro Watanabe. 2025. Improving Explainability of Sentence-level Metrics via Edit-level Attribution for Grammatical Error Correction. ACL Student Research Workshop (SRW) 2025.
Toma Suzuki, Yusuke Sakai, Justin Vasselli, Hidetaka Kamigaito and Taro Watanabe. 2025. Superfluous Instruction: Vulnerabilities Stemming from Task-Specific Superficial Expressions in Instruction Templates. The 3rd Workshop on Towards Knowledgeable Foundation Models (KnowFM 2025).
Toma Suzuki, Ayuki Katayama, Seiji Gobara, Ryo Tsujimoto, Hibiki Nakatani, Kazuki Hayashi, Yusuke Sakai, Hidetaka Kamigaito and Taro Watanabe. 2025. Reliability of Distribution Predictions by LLMs: Insights from Counterintuitive Pseudo-Distributions. NAACL Student Research Workshop (SRW) 2025.
Seiji Gobara, Hidetaka Kamigaito and Taro Watanabe. 2025. Speaker Identification and Dataset Construction Using LLMs: A Case Study on Japanese Narratives. The 7th Workshop on Narrative Understanding (WNU 2025).
Akari Haga, Akiyo Fukatsu, Miyu Oba, Arianna Bisazza and Yohei Oseki. 2024. BabyLM Challenge: Exploring the effect of variation sets on language model training efficiency. The 2nd BabyLM Challenge at the 28th Conference on Computational Natural Language Learning. Outstanding Paper Award
Adam Nohejl, Akio Hayakawa, Yusuke Ide and Taro Watanabe. 2024. Difficult for Whom? A study of Japanese Lexical Complexity. The Third Workshop on Text Simplification, Accessibility and Readability (TSAR 2024).
Yusuke Sakai, Adam Nohejl, Jiangnan Hang, Hidetaka Kamigaito and Taro Watanabe. 2024. Toward the Evaluation of Large Language Models Considering Score Variance across Instruction Templates. The BlackboxNLP Workshop (BlackboxNLP 2024).
Ayuki Katayama, Yusuke Sakai, Shohei Higashiyama, Hiroki Ouchi, Ayano Takeuchi, Ryo Bando, Yuta Hashimoto, Toshinobu Ogiso and Taro Watanabe. 2024. Evaluating Language Models in Location Referring Expression Extraction from Early Modern and Contemporary Japanese Texts. The 4th International Workshop on Natural Language Processing for Digital Humanities (NLP4DH 2024).
Yuji Oshima, Hiroyuki Shindo, Hiroki Teranishi, Hiroki Ouchi and Taro Watanabe. 2024. Synthetic Context with LLM for Entity Linking from Scientific Tables. SDProc 2024.
Xincan Feng, Hidetaka Kamigaito, Katsuhiko Hayashi and Taro Watanabe. 2024. Unified Interpretation of Smoothing Methods for Negative Sampling Loss Functions in Knowledge Graph Embedding. Repl4NLP 2024.
Ken Nishida, Kojiro Machi, Kazuma Onishi, Katsuhiko Hayashi and Hidetaka Kamigaito. 2024. Multi-label Learning with Random Circular Vectors. Repl4NLP 2024.
Kosuke Doi, Yuka Ko, Mana Makinae, Katsuhito Sudoh and Satoshi Nakamura. 2024. Word Order in English-Japanese Simultaneous Interpretation: Analyses and Evaluation using Chunk-wise Monotonic Translation. IWSLT 2024.
Yuka Ko, Ryo Fukuda, Yuta Nishikawa, Yasumasa Kano, Tomoya Yanagita, Kosuke Doi, Mana Makinae, Haotian Tan, Makoto Sakai, Sakriani Sakti, Katsuhito Sudoh and Satoshi Nakamura. 2024. NAIST Simultaneous Speech Translation System for IWSLT 2024. IWSLT 2024.
Yuhi Matogawa, Yusuke Sakai, Taro Watanabe and Chihiro Taguchi. 2024. Japanese Rule-based Grapheme-to-phoneme Conversion System and Multilingual Named Entity Dataset with International Phonetic Alphabet. SIGMORPHON 2024.
Justin Vasselli, Arturo Martínez Peguero, Junehwan Sung and Taro Watanabe. 2024. Applying Linguistic Expertise to LLMs for Educational Material Development in Indigenous Languages. AmericasNLP 2024. 1st Prize in the Shared Task 2
Matthew Shardlow, Fernando Alva-Manchego, Riza Batista-Navarro, Stefan Bott, Saul Calderon Ramirez, Rémi Cardon, Thomas François, Akio Hayakawa, Andrea Horbach, Anna Huelsing, Yusuke Ide, Joseph Marvin Imperial, Adam Nohejl, Kai North, Laura Occhipinti, Nelson Peréz Rojas, Nishat Raihan, Tharindu Ranasinghe, Martin Solis Salazar, Sanja Stajner, Marcos Zampieri and Horacio Saggion. 2024. The BEA 2024 Shared Task on the Multilingual Lexical Simplification Pipeline. BEA 2024.
Kosuke Doi, Katsuhito Sudoh and Satoshi Nakamura. 2024. Automated Essay Scoring Using Grammatical Variety and Errors with Multi-Task Learning and Item Response Theory. BEA 2024.
Arturo Martinez Peguero. 2024. Change My Frame: Reframing in the Wild in r/ChangeMyView. LatinXinAI (to appear).
Matthew Shardlow, Fernando Alva-Manchego, Riza Batista-Navarro, Stefan Bott, Saul Calderon Ramirez, Rémi Cardon, Thomas François, Akio Hayakawa, Andrea Horbach, Anna Hülsing, Yusuke Ide, Joseph Marvin Imperial, Adam Nohejl, Kai North, Laura Occhipinti, Nelson Peréz Rojas, Nishat Raihan, Tharindu Ranasinghe, Martin Solis Salazar, Marcos Zampieri and Horacio Saggion. 2024. An Extensible Massively Multilingual Lexical Simplification Pipeline Dataset using the MultiLS Framework. 3rd Workshop on Tools and Resources for People with REAding DIfficulties (READI).
Yuto Nishida, Makoto Morishita, Hidetaka Kamigaito and Taro Watanabe. 2024. Generating Diverse Translation with Perturbed kNN-MT. EACL 2024 Student Research Workshop.
Miyu Oba, Akari Haga, Akiyo Fukatsu and Yohei Oseki. 2023. BabyLM Challenge: Curriculum learning based on sentence complexity approximating language acquisition. the BabyLM Challenge at the 27th Conference on Computational Natural Language Learning.
Justin Vasselli, Christopher Vasselli, Adam Nohejl and Taro Watanabe. 2023. NAISTeacher: A Prompt and Rerank Approach to Generating Teacher Utterances in Educational Dialogues. 18th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2023). 1st Rank in BEA 2023 Shared Task
Justin Vasselli and Taro Watanabe. 2023. A Closer Look at k-Nearest Neighbors Grammatical Error Correction. 18th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2023).
Yusuke Ide, Masato Mita, Adam Nohejl, Hiroki Ouchi, and Taro Watanabe. 2023. Japanese Lexical Complexity for Non-Native Readers: a New Dataset. 18th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2023).
Akio Hayakawa, Tomoyuki Kajiwara, Hiroki Ouchi and Taro Watanabe. 2022. JADES: New Text Simplification Dataset in Japanese Targeted at Non-Native Speakers. Workshop on Text Simplification, Accessibility, and Readability (TSAR-2022).
Xincan Feng, Zhi Qu, Yuchang Cheng, Taro Watanabe and Nobuhiro Yugami. 2022. Sharing Parameter by Conjugation for Knowledge Graph Embeddings in Complex Space. TextGraphs-16.
Chihiro Taguchi, Sei Iwata and Taro Watanabe. 2022. Universal Dependencies Treebank for Tatar: Incorporating Intra-Word Code-Switching Information. Workshop on Resources and Technologies for Indigenous, Endangered and Lesser-resourced Languages (EURALI-2022).
Van-Hien Tran, Hiroki Ouchi, Taro Watanabe and Yuji Matsumoto. 2022. Improving Discriminative Learning for Zero-Shot Relation Extraction. 1st Workshop on Semiparametric Methods in NLP: Decoupling Logic from Knowledge (SpaNLP).
Shohei Higashiyama, Masao Utiyama, Taro Watanabe and Eiichiro Sumita. 2021. A Text Editing Approach to Joint Japanese Word Segmentation, POS Tagging, and Lexical Normalization. Seventh Workshop on Noisy User-generated Text (W-NUT 2021). Best Paper Award
Yushi Hirose, Shimbo Masashi and Taro Watanabe. 2021. Transductive Data Augmentation with Relational Path Rule Induction for Knowledge Graph Embedding. International Workshop on Knowledge Graph: Heterogeneous Graph Deep Learning and Applications.
Shintaro Harada and Taro Watanabe. 2021. Neural Machine Translation with Synchronous Latent Phrase Structure. ACL-IJCNLP 2021 Student Research Workshop.
Sei Iwata, Taro Watanabe and Masaaki Nagata. 2021. Zero Pronouns Identification based on Span prediction. ACL-IJCNLP 2021 Student Research Workshop.
Hiroyuki Deguchi, Akihiro Tamura and Takashi Ninomiya. 2021. Synchronous Syntactic Attention for Transformer Neural Machine Translation. ACL-IJCNLP 2021 Student Research Workshop.
Chihiro Taguchi, Yusuke Sakai and Taro Watanabe. 2021. Transliteration for Low-Resource Code-Switching Texts: Building an Automatic Cyrillic-to-Latin Converter for Tatar. Fifth Workshop on Computational Approaches to Linguistic Code-Switching (CALCS 2021).
Takayoshi Shibahara, Ikuya Yamada, Noriki Nishida, Shanshan Liu, Kouji Kozaki, Taro Watanabe and Yuji Matsumoto. 2020. Preliminary Experiments of Span-based Distant Supervision for Biomedical NER. Fourth International Workshop on SCIentific DOCument Analysis (SCIDOCA 2020).
Yuya Sawada, Hiroki Teranishi and Yuji Matsumoto. 2020. Coordination Identification for Composite Named Entity Normalization. Fourth International Workshop on SCIentific DOCument Analysis (SCIDOCA 2020).
Hien Van Tran, Phuong Minh Nguyen, Chau Minh Nguyen, Ken Satoh, Yuji Matsumoto and Minh Le Nguyen. 2020. CovRelex: A COVID-19 Retrieval System with Relation Extraction. Fourth International Workshop on SCIentific DOCument Analysis (SCIDOCA 2020).
Shanshan Liu, Matsunori Uenuma, Hiroyuki Shindo and Yuji Matsumoto. 2020. Extraction of the Material Synthesis Procedure. Fourth International Workshop on SCIentific DOCument Analysis (SCIDOCA 2020).

Presentations at conferences/SIGs

王略丞, 林克彦, 上垣外英剛. 2026. メタファー判断における LLM-as-a-Judge の安定性分析：モデル・プロンプト・人間判断の比較. NLP2026.
尾崎慎太郎, 橋本航, 林克彦, 上垣外英剛, 渡辺太郎. 2026. n-gramに基づく推論モデルの信頼度と較正特性の分析. NLP2026.
Yuka Ko, Ryo Fukuda, Yuta Nishikawa, Yasumasa Kano, Katsuhito Sudoh, Sakriani Sakti, Satoshi Nakamura. 2026. End-to-end Simultaneous Speech Translation with Style Tags using Human Simultaneous Interpretation Data. NLP2026.
城戸晴輝, 上垣外英剛, 村上聡一朗, 高村大也, 奥村学. 2026. 読者の質問と予想が駆動する物語生成. NLP2026.
Riza Setiawan Soetedjo, Yusuke Sakai, Hidetaka Kamigaito, Jingun Kwon, Manabu Okumura, Taro Watanabe. 2026. Toward Factual Summarization through Consensus and Consistency. NLP2026.
澤田悠冶, 安井雄一郎, 渡辺太郎. 2026. 日本語エンティティ曖昧性解消の体系的評価. NLP2026.
橋本航, 上垣外英剛, 渡辺太郎. 2026. データ拡張による固有表現抽出の不確実性推定. NLP2026.
坂上温紀, Zhi Qu, 上垣外英剛, 高村大也, 谷中瞳, 渡辺太郎. 2026. 大規模視覚言語モデルにおける視覚情報の伝播経路と Registering の考察. NLP2026.
Justin Vasselli, Arturo Martínez Peguero, Frederikus Hudi, 坂上温紀, 渡辺太郎. 2026. Measuring Linguistic Competence of LLMs on Indigenous Languages of the Americas. NLP2026.
馮思遠, 林克彦, 上垣外英剛, 鷲尾光樹, 平尾努. 2026. レイアウト構造木を介したマンガページ生成手法：視覚・テキスト特徴の有効性比較. NLP2026.
王略丞, 尾崎慎太郎, 上垣外英剛, 林克彦, Jingun Kwon, 奥村学, 渡辺太郎. 2026. 画像生成モデルにおける直喩喩体の生成挙動分析. NLP2026. Committee Special Award
鼎凌太朗, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. ミーム画像に対する自己スコアリング選別による推論根拠付き回答の検証. NLP2026.
志子田直輝, 五藤巧, 西田悠人, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. CLIPと不均衡最適輸送を用いた画像–文章間の類似性評価および局所アライメントの可視化. NLP2026.
門谷拓能, 神野倫行, 坂井優介, 渡辺太郎. 2026. 出力制約と表記正規化による LLM 形式証明のタクティク選択評価. NLP2026.
坂上温紀, Frederikus Hudi, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. 全域木による言語モデルの分析. NLP2026.
出口祥之, 帖佐克己, 坂井優介. 2026. 単一のhubテキストがCLIPを壊す：hubnessによるクロスモーダル埋め込みの脆弱性特定. NLP2026. Committee Special Award
Maria Angelica Riera Machin, Adam Nohejl, Taro Watanabe. 2026. Using the CEFR for Guiding LLMs in Lexical Complexity Prediction. NLP2026.
蒔苗茉那, 五藤巧, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. 文埋め込みモデルの内部表現と不均衡最適輸送を用いた機械翻訳自動評価. NLP2026.
上垣外英剛, 村上聡一朗, 張培楠. 2026. 広告文におけるスパン単位の誤り推定. NLP2026.
尾崎慎太郎, 平岡達也, 大竹啓永, 大内啓樹, 磯沼大, Benjamin Heinzerling, 乾健太郎, 渡辺太郎, 宮尾祐介, 大関洋平, 高木優. 2026. 大規模言語モデルの潜在言語は一貫しているべきか？. NLP2026. Committee Special Award
加藤優汰, 尾崎慎太郎, 林和樹, 坂井優介, 上垣外英剛, 林克彦, 渡辺太郎. 2026. 知識グラフの反復的な探索による画像の詳細な説明文の生成. NLP2026.
水津徹久, 東山翔平, 進藤裕之, 大内啓樹, サクティサクリアニ. 2026. 空間・エンティティ制約下における地理空間推論のための構成的質問応答ベンチマークの自動生成. NLP2026.
藤田剛, 澤田悠冶, 坂井優介, 渡辺太郎. 2026. 法令間委任関係におけるマルチラベル委任先条文特定. NLP2026.
平川稜真, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. 大規模言語モデルにおける方言生成過程の内部機序分析. NLP2026.
Juseon Do, Sungwoo Han, Jingun Kwon, 上垣外英剛, 林克彦, 渡辺太郎. 2026. 自己整列プロンプティング：長文脈下のランキングタスクのための整列手法. NLP2026.
井手佑翼, Adam Nohejl, Joshua Tanner, 谷中瞳, Christopher Lindsay, 渡辺太郎. 2026. 日本語学習者辞書語釈の自動生成. NLP2026.
Adam Nohejl, Akio Hayakawa, Yusuke Ide, Taro Watanabe. 2026. A Japanese Dataset and Efficient Multilingual LLM-Based Methods for Lexical Simplification and Lexical Complexity Prediction. NLP2026.
村上聡一朗, 上垣外英剛, 高村大也, 奥村学. 2026. 個別選好の異質性を考慮した大喜利ユーモア選好要因の分析. NLP2026. Committee Special Award
長谷川遼, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. JSONFOL: JSON 形式論理式によるニューロシンボリック推論. NLP2026.
辻航平, 岡佑依, 西田京介, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. 疑似グラフデータ学習によるLLMのグラフ理解能力の向上. NLP2026.
北野由香利, 林克彦, 上垣外英剛. 2026. 飲食店名は何を語るか：価格と評価に関わる n-gram 特徴量の分析. NLP2026.
横野光, 平岡達也, 関根聡. 2026. Rationaleの自動生成によるCoTデータセット構築. NLP2026.
大竹啓永, 平岡達也, 宮尾祐介, 大関洋平, 磯沼大. 2026. データマージ:平均化データを用いた学習効率化. NLP2026.
五藤巧, 坂井優介, 渡辺太郎. 2026. LLMベース文法誤り訂正における編集の多数決による過剰訂正の抑制. NLP2026.
帖佐宗浩, 西田悠人, 大羽未悠, 渡辺太郎. 2026. ニューラル言語モデルの学習初期における単語の分節化. NLP2026.
Kit May Shum, Yusuke Sakai, Masahiro Kaneko, Taro Watanabe. 2026. Personality-Aware Suicide Severity Level Detection Using Large Language Models. NLP2026.
唐澤香梨菜, 金山龍起, 幸喜礼佳, 鈴村祐貴, 藤田晴斗, 小原涼馬, 坂井優介, 上垣外英剛, 林克彦, 松野省吾. 2026. InterviewArena：情報量の欠損度合いに着目した不完全情報下での対話型推論能力ベンチマーク. NLP2026.
五藤巧, 坂井優介, 渡辺太郎. 2026. 文法誤り訂正における編集ベクトルの最適輸送に基づく性能評価尺度. NLP2026.
呂博軒, 村上聡一朗, 上垣外英剛, 張培楠. 2026. 類推に基づくエキスパート割当：kNN検索を用いたMixture-of-Experts. NLP2026. Excellence Award
片岡晴彦, 辻航平, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. Tighter Locality: 大規模言語モデルにおける知識編集手法のより厳密な局所性評価. NLP2026.
東山翔平, 大内啓樹, 橋本雄太, 藤田篤. 2026. 中世・近世日本語資料の現代語機械翻訳：評価用対訳データセットの構築とLLMの性能評価. NLP2026.
土肥康輔, 蒔苗茉那, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. Simul-COMET: 原発話との語順差を考慮した同時通訳評価指標. NLP2026.
吉田大城, 出口祥之, 坂井優介, 上垣外英剛, 渡辺太郎. 2026. 構造的整合性に基づく最小ベイズリスクテーブル生成. NLP2026.
大竹啓永, 張培楠, 坂井優介, 大内啓樹, 渡辺太郎. 2026. AdTEx：大規模言語モデルを活用した多様な広告テンプレート拡張フレームワーク. NLP2026.
林和樹, 尾崎慎太郎, 神野倫行, 上垣外英剛, 渡辺太郎. 2026. Noisy Channel に基づく生成確率による画像生成評価. NLP2026. Excellence Award
藤田剛, 澤田悠冶, 坂井優介, 渡辺太郎. 2025. 法令文における法令間委任関係の自動抽出. IPSJ SIG NL (in Japanese). Excellent Research Award
帖佐宗浩, 西田悠人, 大羽未悠, 渡辺太郎. 2025. ニューラル言語モデルの学習初期における単語の分節化. IPSJ SIG NL (in Japanese).
岩國巧, 出口祥之, 永田昌明, 上垣外英剛, 渡辺太郎. 2025. 誤り単語の混入による単語単位翻訳誤り検出の頑健性評価. IPSJ SIG NL (in Japanese). Excellent Research Award
尾崎慎太郎, 加藤優汰, 馮思遠, 富田雅代, 林和樹, 小原涼馬, 小山田昌史, 林克彦, 上垣外英剛, 渡辺太郎. 2025. 検索拡張生成が信頼度に及ぼす影響：医療分野における分析. NLP2025.
片山歩希, 東山翔平, 大内啓樹, 坂井優介, 竹内綾乃, 坂東諒, 橋本雄太, 小木曽智信, 渡辺太郎. 2025. 近世・近代・現代日本語テキストに対する場所参照表現抽出. NLP2025.
蒔苗茉那, 坂井優介, 上垣外英剛, 渡辺太郎. 2025. 訳出の同時性に特化した評価データを用いた同時音声翻訳モデルの評価と分析. NLP2025. Mirai Translate Award
Zhe Cao, Yusuke Oda, Akiko Aizawa, Taro Watanabe. 2025. Towards Modular Fine-tuning of LLM-based Multilingual Neural Machine Translation. NLP2025.
土肥康輔, 胡尤佳, 蒔苗茉那, 須藤克仁, 中村哲, 渡辺太郎. 2025. 順送り訳データに基づく英日同時機械翻訳の評価. NLP2025.
田口智大, 倉部慶太, 坂井優介, Rita Seng Mai Nbanpa. 2025. フィールドワークデータによるジンポー語機械翻訳. NLP2025.
澤田悠冶, 大内啓樹, 安井雄一郎, 寺西裕紀, 松本裕治, 渡辺太郎, 石井昌之. 2025. 沿革情報を用いた企業名変遷の構造化. NLP2025.
郷原聖士, 上垣外英剛, 渡辺太郎. 2025. 大規模言語モデルを用いた物語分析データセットの効率的構築：日本語物語の話者推定を例として. NLP2025.
北野雄士, 西田悠人, 坂上温紀, 上垣外英剛, 渡辺太郎. 2025. 独立成分分析による事前学習済み多言語モデルの層を横断した単語埋め込み表現の分析. NLP2025.
西田悠人, 志子田直輝, 岸波洋介, 藤井諒, 森下睦, 上垣外英剛, 渡辺太郎. 2025. Wikipediaリダイレクト情報を活用したエンティティベース質問応答データセットの構築. NLP2025.
鈴木刀磨, 片山歩希, 郷原聖士, 辻本陵, 中谷響, 林和樹, 坂井優介, 上垣外英剛, 渡辺太郎. 2025. 大規模言語モデルの分布予測における常識に基づいた割合予測能力の評価. NLP2025. Committee Special Award
橋本航, 上垣外英剛, 渡辺太郎. 2025. 復号手法が大規模言語モデルにおける不確実性推定に与える影響の調査. NLP2025.
坂上温紀, 坂井優介, 上垣外英剛, 渡辺太郎. 2025. 満洲語古典語における母音調和の計算言語学的考察. NLP2025.
坂井優介, 五藤巧, 渡辺太郎. 2025. IMPARA-GED：言語モデルの文法誤り検出能力に着目した文法誤り訂正の参照文なし自動評価. NLP2025. Young Researcher Award
Justin Vasselli, Arturo Martínez Peguero, 渡辺太郎. 2025. Incorporating Rule-Based Methods with Prompt-Based Techniques for Indigenous Language Generation. NLP2025.
五藤巧, 坂井優介, 渡辺太郎. 2025. 文法誤り訂正における人手評価と自動評価の乖離とその解決. NLP2025.
吉田大城, 林和樹, 坂井優介, 上垣外英剛, 林克彦, 渡辺太郎. 2025. 大規模視覚言語モデルにおける言語タスクに対する視覚情報の影響. NLP2025. Committee Special Award
芳賀あかり, 深津聡世, 大羽未悠, Arianna Bisazza, 大関洋平. 2025. 言語モデルの事前学習におけるバリエーションセットの効果. NLP2025. Young Researcher Award
Adam Nohejl, 渡辺太郎. 2025. Dispersion Measures as Predictors of Lexical Decision Time, Word Familiarity, and Lexical Complexity. NLP2025.
河野真有香, 平尾悠太朗, Monica Perusquía-Hernández, 内山英昭, 上垣外英剛, 清川清. 2025. LLMはASD小児と定型発達小児が作成したストーリーを識別できるか？. NLP2025.
坂上温紀, Justin Vasselli, 井手佑翼, 坂井優介, Yingtao Tian, 上垣外英剛, 渡辺太郎. 2025. 低資源言語のための辞書を用いた言語間語彙転移. NLP2025.
長谷川遼, 坂井優介, 上垣外英剛, 渡辺太郎. 2025. 知識編集がconfidence calibrationへ与える影響. NLP2025.
辻本陵, 坪内孝太, 山下達雄, 松田裕貴, 諏訪博彦, 大内啓樹. 2025. レビュー情報を用いたLLMによる観光地比較表生成. NLP2025.
上垣外英剛, 出口祥之, 坂井優介, 林克彦, 渡辺太郎. 2025. 最小ベイズリスク復号におけるバイアスと多様性の分解. NLP2025.
杉山咲, 蒔苗茉那, 片山歩希, 坂井優介, 山口賢一, 渡辺太郎. 2025. 大規模言語モデルを用いたソースコードからのドキュメント生成能力調査. NLP2025.
Ying Zhang, 上垣外英剛, 奥村学. 2025. Bidirectional Transformer Reranker for Grammatical Error Correction. NLP2025.
坂井優介, 上垣外英剛, 林克彦, 渡辺太郎. 2025. 未知の知識に対する事前学習済み言語モデルが持つ推論能力の調査. NLP2025.
中谷響, 安井雄一郎, 若本亮佑, 石井昌之, 大内啓樹, 渡辺太郎. 2025. Wikidataに基づく大規模ジオコーディングデータセット. NLP2025. Young Researcher Award
尾崎慎太郎, 平岡達也, 大竹啓永, 大内啓樹, 渡辺太郎, 宮尾祐介, 大関洋平, 高木優. 2025. 大規模言語モデルにおけるペルソナの役割と内部動作の理解. NLP2025.
大南英理, 宮西大樹, 前田航希, 栗田修平. 2025. 多言語での判例事実概要からの法的関係性のグラフ可視化. NLP2025. Committee Special Award
佐藤岳大, 尾崎慎太郎, 横山大作. 2025. 戦略的発話の多様な生成を目指した人狼エージェントの構築. NLP2025.
西田悠人, 小田悠介, Namgi Han, 高木優, 宮尾祐介. 2025. 日本語大規模言語モデルの事前訓練過程における下流タスク性能の網羅的な分析. NLP2025.
大竹啓永, 張培楠, 坂井優介, 三田雅人, 大内啓樹, 渡辺太郎. 2025. 広告画像ランキングによる視覚言語モデルの評価. NLP2025.
Kosuke Doi, Katsuhito Sudoh, Satoshi Nakamura. 2025. NAIST Simultaneous Interpretation Corpus: Development and Analyses of Data from Interpreters of Different Levels. NLP2025.
村上聡一朗, 張培楠, 上垣外英剛, 高村大也, 奥村学. 2025. AdParaphrase: 魅力的な広告表現の分析を目的とした広告文言い換えデータセット. NLP2025.
大西雄真, 西田拳, 林克彦, 上垣外英剛. 2025. Gated Recurrent Unitの簡略化と学習型Bloom Filterへの影響. NLP2025.
林和樹, 上垣外英剛, 幸田慎也, 渡辺太郎. 2025. IterKey: LLMを用いた反復的キーワード生成による検索拡張生成の最適化. NLP2025.
五藤巧, 堤田恭太, 村瀬文彦, 三谷陽, 渡辺太郎. 2025. k近傍事例に基づく埋め込み表現のドメイン適応と検索への応用. NLP2025.
中根稜介, 前川在, 上垣外英剛, 平尾努, 奥村学. 2025. 大規模言語モデルを用いたシフト還元型句構造解析. NLP2025.
井手佑翼, Joshua Tanner, Adam Nohejl, Justin Vasselli, 上垣外英剛, 渡辺太郎. 2025. 複単語表現検出におけるLLMファインチューニングの有効性. NLP2025.
Tomoyki Jinno, Kazuki Hayashi, Yusuke Sakai, Hidetaka Kamigaito, Taro Watanabe. 2025. Cosine Similarity as Logits?: Few-shot Knowledge Graph Completion with Embedding Vectors of a Generative PLM and its Application in Knowledge Probing. NLP2025.
西田悠人, 小田悠介. 2025. LLMの学習過程におけるタスク性能の不安定性とその緩和. IPSJ SIG NL (in Japanese). Young Researcher Award
平野颯, 上垣外英剛, 渡辺太郎. 2025. 大規模言語モデルにおける言語知識の所在について. IPSJ SIG NL (in Japanese).
夏見昂樹, 出口祥之, 坂井優介, 上垣外英剛, 渡辺太郎. 2025. 知識蒸留モデルと合意をとる頑健な行列補完を用いた高速な確率的最小ベイズリスク復号. IPSJ SIG NL (in Japanese).
多田智貴, 林克彦, 上垣外英剛, 松野省吾. 2024. 登録に議論が必要なWikipedia項目への自動登録に向けた調査. IPSJ SIG NL (in Japanese).
尾崎慎太郎, 林和樹, 坂井優介, 上垣外英剛, 林克彦, 渡辺太郎. 2024. 大規模視覚言語モデルによる芸術作品の多言語説明生成. IPSJ SIG NL (in Japanese).
鈴木刀磨, 片山歩希, 郷原聖士, 辻本陵, 中谷響, 林和樹, 坂井優介, 上垣外英剛, 渡辺太郎. 2024. 大規模言語モデルによる選択肢間の関係を考慮した回答分布予測手法の提案. IPSJ SIG NL (in Japanese).
蒔苗茉那, 坂井優介, 上垣外英剛, 渡辺太郎. 2024. Simul-MuST-C：大規模言語モデルによる語順の単調性に着目した同時音声翻訳用コーパスの構築. IPSJ SIG NL (in Japanese). Young Researcher Award
五藤巧, 出口祥之, 上垣外英剛, 渡辺太郎. 2024. k近傍事例を用いたニューラルモデルの予測における定量的な解釈. IPSJ SIG NL (in Japanese).
井手佑翼, 西田悠人, 大羽未悠, 坂井優介, Justin Vasselli, 上垣外英剛, 渡辺太郎. 2024. Investigating Acceptability Judgment Methods Suitable for Large Language Models. IPSJ SIG NL (in Japanese). Young Researcher Award
出口祥之, 坂井優介, 上垣外英剛, 渡辺太郎. 2024. 疑似参照訳文ベクトルの重心に基づく高速なニューラル最小ベイズリスク復号. NLP 2024. SmartESG (Cierpa & Company) Award
平野颯, 上垣外英剛, 渡辺太郎. 2024. 深層学習モデルにおける言語特徴分布に関する研究. NLP 2024.
大嶋悠司, 進藤裕之, 寺西裕紀, 大内啓樹, 渡辺太郎. 2024. LLM による合成文脈データを用いた表のエンティティリンキング. NLP 2024.
大南英理, 栗田修平, 宮西大樹, 渡辺太郎. 2024. JDocQA: 図表を含む日本語文書質問応答データセットによる大規模言語モデルチューニング. NLP 2024. Young Researcher Award PKSHA Technology Award Money Forward Award
郷原聖士, 上垣外英剛, 渡辺太郎. 2024. LLM はユーザーに適したテキストの難易度を暗黙的に考慮しているのか？. NLP 2024.
山本和太郎, 大友寛之, 大内啓樹, 東山翔平, 寺西裕紀, 進藤裕之, 渡辺太郎. 2024. 移動軌跡解析：文章中の人物の地理的な移動を読み取る. NLP 2024.
林和樹, 坂井優介, 上垣外英剛, 林克彦, 渡辺太郎. 2024. Large-scale Vision Language Modelによる芸術作品に対する説明の生成. NLP 2024.
齊藤成輝, 林和樹, 井手佑翼, 坂井優介, 鈴木刀磨, 郷原聖士, 大西雄真, 上垣外英剛, 林克彦, 渡辺太郎. 2024. Vision Language Modelが持つ画像批評能力の評価手法の提案. NLP 2024.
中谷響, 寺西裕紀, 東山翔平, 大内啓樹, 渡辺太郎. 2024. メンション文脈とエントリ属性を考慮した Transformer Bi-Encoder によるジオコーディング. NLP 2024.
東山翔平, 大内啓樹, 寺西裕紀, 大友寛之, 井手佑翼, 山本和太郎, 進藤裕之, 渡辺太郎. 2024. 日本語旅行記ジオパージングデータセットATD-MCL. NLP 2024. Committee Special Award
辻本陵, 大内啓樹, 上垣外英剛, 渡辺太郎. 2024. 衛星画像の時系列変化説明に向けたLVLMの比較. NLP 2024.
浅野輝, 米谷竜, 関井大気, 大内啓樹. 2024. Text2Traj2Text: 大規模言語モデルを活用した段階的データ生成に基づく人物移動軌跡の言語化. NLP 2024.
四條光, 進藤裕之, 渡辺太郎. 2024. 画像ベースとテキストベースのモデルを用いた表の構造解析の性能検証. NLP 2024.
Junehwan Sung, 上垣外英剛, 渡辺太郎. 2024. Exploring Metalinguistic Awareness in Pre-trained Language Models through the International Linguistics Olympiad Challenges. NLP 2024.
富村勇貴, 上垣外英剛, 渡辺太郎. 2024. 固有名詞置換による共参照解析データセットの拡張. NLP 2024.
五藤巧, 渡辺太郎. 2024. 文法誤り訂正における参照なし評価尺度を用いた分析的評価法. NLP 2024. Young Researcher Award
芳賀あかり, 菅原朔, 深津聡世, 大羽未悠, 大内啓樹, 渡辺太郎, 大関洋平. 2024. 小規模言語モデルによる子供の過剰一般化のモデリング. NLP 2024.
坂井優介, 上垣外英剛, 渡辺太郎. 2024. Multilingual CommonsenseQA. NLP 2024.
Justin Vasselli, Taro Watanabe. 2024. Adversarial Evaluation of Dialogue System Metrics. NLP 2024.
大羽未悠, 大関洋平, 深津聡世, 芳賀あかり, 大内啓樹, 渡辺太郎, 菅原朔. 2024. 言語モデルの文法知識評価における間接肯定証拠の分析. NLP 2024.
橋本航, 上垣外英剛, 渡辺太郎. 2024. データ拡張による固有表現抽出の不確実性推定. NLP 2024.
澤田悠冶, 安井雄一郎, 大内啓樹, 渡辺太郎, 石井昌之, 石原祥太郎, 山田剛, 進藤裕之. 2024. 日経企業 ID リンキングのための類似度ベース EL システムの構築と分析. NLP 2024.
前川在, 平尾努, 上垣外英剛, 奥村学. 2024. 大規模言語モデルによるシフト還元修辞構造解析の模倣. NLP 2024.
帖佐克己, 上垣外英剛, 渡辺太郎. 2024. 翻訳文の部分構造を制約とした機械翻訳. NLP 2024. Young Researcher Award
kNN言語モデルは低頻度語の予測に役立つか？. 2024. 西田悠人, 森下睦, 出口祥之, 上垣外英剛, 渡辺太郎. NLP 2024. Young Researcher Award
白井尚登, 上垣外英剛, 渡辺太郎. 2024. Scalar Mixing Weightsを用いた生成タスクにおける視覚と言語の情報を事前学習したモデルの分析. IPSJ SIG NL (in Japanese).
鈴木刀磨, 坂井優介, 上垣外英剛, 渡辺太郎. 2024. 大規模言語モデルにおけるタスク特有の表層表現に起因する脆弱性の調査. IPSJ SIG NL (in Japanese).
武内樹治, 大内啓樹, 東山翔平. 2023. 歴史災害史料からの自動地名抽出に向けた自然言語処理システムの性能評価. 人文科学とコンピュータシンポジウム2023.
西田拳, 林克彦, 町光二郎, 上垣外英剛. 2023. ランダム巡回ベクトルを用いたマルチラベル学習. IPSJ SIG NL (in Japanese).
片山歩希, 東山翔平, 大内啓樹, 渡辺太郎. 2023. 歴史的日本語資料を対象とした場所参照表現抽出―「おくのほそ道」を例として―. IPSJ SIG NL (in Japanese).
坂井優介, ノヘイルアダム, 上垣外英剛, 渡辺太郎. 2023. 大規模言語モデルの統一評価に向けた指示テンプレートの提案及びその評価結果の考察. IPSJ SIG NL (in Japanese). Excellent Research Award
坂井優介, 上垣外英剛, 林克彦, 渡辺太郎. 2023. 未知の知識に対する事前学習済み言語モデルが持つ推論能力の調査. IPSJ SIG NL (in Japanese). Excellent Research Award
山本和太郎, 東山翔平, 大内啓樹, 大友寛之, 井手佑翼, 進藤裕之, 渡辺太郎. 2023. 移動軌跡可視化のための旅行記への訪問順序アノテーション. JSAI 2023 (in Japanese).
大嶋悠司, 進藤裕之, 渡辺太郎. 2023. 引用文献に着目した情報科学論文からのデータセットの抽出. IPSJ SIG NL (in Japanese).
Yuya Sawada, Hiroki Teranishi, Hiroki Ouchi, Yuji Matsumoto and Taro Watanabe. 2023. Estimating Named Entity Label Representation for Generative Low-Resource NER. IPSJ SIG NL (in Japanese).
廣瀬惟歩, 渡辺太郎. 2023. 日英翻訳を対象としたイディオム表現の評価指標の提案. NLP 2023.
五藤巧, 渡辺太郎. 2023. 訂正文の流暢性向上を目的とした系列タグ付け文法誤り訂正器の強化学習手法. NLP 2023.
西田悠人, 森下睦, 上垣外英剛, 渡辺太郎. 2023. 摂動を加えたkNN機械翻訳による多様な翻訳候補の生成. NLP 2023.
出口祥之, 渡辺太郎, 松井勇佑, 内山将夫, 田中英輝, 隅田英一郎. 2023. 近傍文検索を用いたサブセットkNNニューラル機械翻訳. NLP 2023.
大羽未悠, 栗林樹生, 大内啓樹, 渡辺太郎. 2023. 言語モデルの第二言語獲得. NLP 2023. Young Researcher Award
Xincan Feng, 上垣外英剛, 林克彦, 渡辺太郎. 2023. 知識グラフ補完のためのモデル予測に基づくサブサンプリング. NLP 2023.
星野智紀, 上垣外英剛, 渡辺太郎. 2023. 忠実性向上のためにn-gramの抽出性を報酬とする強化学習を用いる抽象型要約. NLP 2023.
亀井遼平, 横井祥, 仲村祐希, 渡辺太郎, 乾健太郎. 2023. 柔らかいジャンプ付き編集距離に向けて. NLP 2023.
張培楠, 坂井優介, 三田雅人, 大内啓樹, 渡辺太郎. 2023. AdGLUE: 広告言語理解ベンチマーク. NLP 2023.
芝原隆善, 山田育矢, 西田典起, 寺西裕紀, 大内啓樹, 古崎晃司, 渡辺太郎, 松本裕治. 2023. エンティティの階層的分類体系を用いた遠距離教師あり固有表現抽出. NLP 2023.
前川在, 小林尚輝, 平尾努, 上垣外英剛, 奥村学. 2023. 逆翻訳を利用したデータ拡張による文間の修辞構造解析の改善. NLP 2023.
的川雄飛, 坂井優介, 平野颯, 澤田悠冶, 大内啓樹, 渡辺太郎. 2023. ルールベースG2Pによる多言語固有表現の国際音声記号表記付きデータセットの構築. NLP 2023.
芳賀あかり, 平尾努, 帖佐克己, 本多右京, 出口祥之, 渡辺太郎. 2023. 画像キャプショニングのための制約語の抽出法. NLP 2023.
白井尚登, 上垣外英剛, 渡辺太郎. 2023. エッジプロービングを用いた事前学習済みの視覚と言語に基づくモデルにおける言語知識の分析. NLP 2023.
久本空海, 西尾悟, 井口奏大, 古川泰人, 大友寛之, 東山翔平, 大内啓樹. 2023. 場所参照表現と位置情報を紐付けるジオコーディングの概観と発展に向けての考察. NLP 2023.
村上聡一朗, 菊田洸, 張培楠, 上垣外英剛, 高村大也, 奥村学. 2023. 原文の書き換えによる広告文生成. NLP 2023.
川畑輝, 菅原朔. 2023. 読解問題における論理推論の一貫性評価. NLP 2023. Young Researcher Award
大内啓樹, 進藤裕之, 若宮翔子, 松田裕貴, 井之上直也, 東山翔平, 中村哲, 渡辺太郎. 2023. 地球の歩き方旅行記データセット. NLP 2023.
大友寛之, 東山翔平, 大内啓樹, 山本和太郎, 井手佑翼, 進藤裕之, 渡辺太郎. 2023. 旅行記中の場所に対する訪問状態の予測. NLP 2023.
齋藤玲, 大内啓樹, 羽鳥康裕, 邑本俊亮, 杉浦元亮, 塩入諭, 柴山明寛. 2023. 震災アーカイブと震災アーカイブwebに関する概念モデルの作成. NLP 2023.
上垣外英剛, 林克彦, 渡辺太郎. 2023. 視覚と言語の融合モデルにおける知識の振る舞いを調査するための表と画像の生成タスクの提案及びその調査結果. NLP 2023. Committee Special Award
Miyu Oba, Tatsuki Kuribayashi, Hiroki Ouchi and Taro Watanabe. 2022. 言語モデルの第二言語獲得効率. IPSJ SIG NL (in Japanese). Excellent Research Award
Yuhi Matogawa. 2022. Classification of /j/ and /w/ in donor languages and notations of /CjV/ and /CwV/ in Japanese. IEICE SIG TL (in Japanese).
Yusuke Ide, Hiroyuki Deguchi, Takumi Goto, Armin Sarhangzadeh and Taro Watanabe. 2022. Studies of the Impact of Subsequent Context Information in Grammatical Error Correction. IPSJ SIG NL (in Japanese).
Takumi Goto, Ryo Nagata and Masato Mita. 2022. Exploring Human-judged and Automatically-induced Correction Difficulty for Grammatical Error Correction. IPSJ SIG NL (in Japanese). Young Researcher Award
Jungmin Choi, Ukyo Honda, Taro Watanabe, Kentaro Inui. 2022. Law Retrieval With Supervised Contrastive Learning Using the Hierarchical Structure of Law. JSAI 2022 (in Japanese). Annual Conference Award
Yuto Harada and Taro Watanabe. 2022. 入れ子型固有表現に対する変分情報ボトルネック法の適用. NLP 2022.
Ukyo Honda, Taro Watanabe and Yuji Matsumoto. 2022. 強化学習における画像キャプションの低識別性問題とLong-Tail分類手法を用いた対処. NLP 2022. Grand Pize
Takayoshi Shibahara, Hiroki Ouchi, Ikuya Yamada, Noriki Nishida, Hiroki Teranishi, Kouji Kozaki, Taro Watanabe and Yuji Matsumoto. 2022. ユーザの興味があるカテゴリに応じたNER システム構築フレームワーク. NLP 2022.
Akihiko Kato, Shuhei Kondo, Hiroyuki Shindo and Taro Watanabe. 2022. 材料科学論文の表の意味解釈データセットの構築. NLP 2022.
Akio Hayakawa, Hiroki Ouchi, Tomoyuki Kajiwara and Taro Watanabe. 2022. テキスト平易化における自動評価指標のメタ評価の検討. NLP 2022.
Yusuke Oda and Yuya Sawada. 2022. 制約抽出のための対訳コーパスを用いた半教師ありクロスリンガル用語推定. NLP 2022.
Hayate Hirano, Hiroki Ouchi and Taro Watanabe. 2022. 多言語機械翻訳への言語類型論特徴の導入. NLP 2022.
Yusuke Sakai, Chihiro Taguchi and Taro Watanabe. 2022. タタール語におけるサブワード単位の言語識別を加味したキリル文字からラテン文字への翻字システムの開発. NLP 2022.
Shintaro Harada, Taro Watanabe and Hiroki Ouchi. 2022. 雑音のある通信路モデルを用いた句構造解析. NLP 2022.
Hiroyuki Otomo, Hiroki Ouchi, Tomoki Hoshino, Yusuke Ide and Taro Watanabe. 2022. 訪問場所表現グラウンディングのためのアノテーション. NLP 2022.
Chihiro Taguchi. 2021. Mermaid construction in Tatar. The 162nd Meeting of the Linguistic Society of Japan.
Yuya Sawada, Hiroki Teranichi, Yuji Matsumoto and Taro Watanabe. 2021. 並列構造解析に基づく複合化された固有表現の曖昧性解消. NLP 2021.
Chihiro Taguchi and Taro Watanabe. 2021. So-Called “Prepositions” in Somali are Not Prepositions: A Linguistic Approach for Somali POS Tagging. NLP 2021.
Takuro Niitsuma and Taro Watanabe. 2021. 文表現の摂動正規化: 事前学習済みモデルのDebias手法. NLP 2021.
Yasuhiro Yamaguchi, Hiroyuki Shindo and Taro Watanabe. 2021. ラベルの不均衡を考慮したEnd-to-End情報抽出モデルの学習. NLP 2021.
Hayate Hirano, Ko Nomura, Hiroyuki Shindo and Taro Watanabe. 2021. 遺伝子二重欠失研究のための関連論文検索手法. NLP 2021.
Yushi Hirose, Masashi Shimbo and Taro Watanabe. 2021. 知識グラフエンベディングのためのリレーションパスルールによるトランスダクティブデータ拡張. NLP 2021.
Sei Iwata, Taro Watanabe and Masaaki Nagata. 2021. 質問応答に基づく日本語ゼロ代名詞同定. NLP 2021.
Yusuke Sakai, Taro Watanabe and Atsuchi Fujita. 2021. 知識グラフ埋め込みを用いたニューラル機械翻訳におけるエンティティ表現の改良. NLP 2021.
Shintaro Harada and Taro Watanabe. 2021. 教師なし同期的句構造を用いた機械翻訳. NLP 2021.
Ukyo Honda, Yoshitaka Ushiku, Atsushi Hashimoto, Taro Watanabe and Yuji Matsumoto. 2021. 画像と単語の不一致を考慮した疑似教師ありキャプション生成. NLP 2021. Young Researcher Award
Takayoshi Shibahara, Ikuya Yamada, Noriki Nishida, Shanshan Liu, Kouji Kozaki, Taro Watanabe and Yuji Matsumoto. 2021. 入れ子になっている固有表現に対する Distant Supervision. NLP 2021.
Yoshitaka Sato, Takashi Wada, Taro Watanabe and Yuji Matsumoto. 2020. Pseudo Data Generation for Grammatical Error Correction Considering the Native Language of English Learners. IPSJ SIG NL (in Japanese). Young Researcher Award
Yuki Yamamoto, Yuji Matsumoto and Taro Watanabe. 2020. Complex Sentence Pattern Lexicon for AMR and Experiments on Semantic Ambiguity Resolution. IPSJ SIG NL (in Japanese).
Chihiro Taguchi. 2020. Raising to quirky subject in Tatar. The 161st Meeting of the Linguistic Society of Japan.

Others (articles, talks etc.)

二宮崇, 出口祥之, 内山将夫, 田村晃裕, 隅田英一郎. 2021. ニューラル機械翻訳のためのバイリンガルサブワード分割の研究. Japio YEAR BOOK 2021.
Taro Watanabe. 2020. Book Review: Neural Machine Translation by Philipp Koehn. AAMT Journal (in Japanese).

Publications

Journal papers

International conferences

Workshops

Presentations at conferences/SIGs

Others (articles, talks etc.)