計算機が言語を理解し言語を生成する、といった自然言語処理を通して、人間がどのように言語を理解し、知識を表現しているのかを解明することが研究テーマです。

自然言語を解析 

自然言語解析のために、アノテーション付きの言語データ、辞書、文法などの基本的な言語データの構築を行っています。 さらに、大規模テキストデータや多言語データを構築するためのツールや環境の整備も行っています。 アノテーション付きの言語データを利用し、形態素解析、係り受け解析、チャンキング、述語項構造解析などの基礎的な言語解析へ機械学習を適用します。 また、深層学習を適用し、単語や文をニューラルネットワークによりモデル化し、大規模テキストデータから学習することで、意味表現および意味構成性に関する研究も行っています。

自然言語から知識獲得

科学技術論文や法律文など、専門分野の文書の言語解析に関する研究、および、知識獲得に関する研究を行っています。 専門性の高い大規模な文書データのテキスト部および引用関係の解析と推論技術により、内容理解を伴った文書検索、文書要約、文書間関係解析技術とその実応用環境を構築しています。

自然言語を生成

深層学習による機械翻訳や要約、キャプション生成の研究を行っています。 対訳データなどの学習データだけでなく、様々な知識を統合したより高精度な翻訳の実現を目指しています。

自然言語の教育・学習支援

日本語を母語としない日本語学習者や、英語を母語としない英語学習者を対象に、作文・読解支援や自動誤り検出・訂正などの研究を行っています。