半教師あり形態素解析 NPYCRF の修正

ACADEMIC

NLP2016（2016）

半教師あり形態素解析 NPYCRF の修正

博報堂

藤井遼

博報堂

道本龍

統計数理研究所

持橋大地

本研究のテーマは「大量の文書から辞書に載っていない新語・俗語・略語などの検出できるか？」です。日本語を含む単語の境界が自明でない言語に対する「分かち書き」タスクに関する研究で、学習データに含まれる単語についてはCRFというモデルで高精度が達成されています。一方、大量の教師なしデータから単語らしい文字列を発見できるNPYLMというモデル、さらに両者を合体させたNPYCRFというモデルが提案されましたが、合体モデルの振る舞いは不安定でした。本研究ではNPYCRF論文の誤りを訂正することで精度が高いまま辞書外の単語も検出できる道筋を示しました。

言語処理学会第22回年次大会発表論文集 (2016年3月)

この記事はいかがでしたか？

送信

この記事に関するお問い合わせはこちら

次の記事に進む

関連記事

2025.04.30

社会全体の仕組みを変えていく必要性　AI研究者・今井翔太さんが唱える今後の社会・日本のあり方とは？
株式会社GenesisAI
- 今井翔太
博報堂
- 冨永直基
2026.03.27

AI共創企業への変革に必要なチェンジマネジメント
三井物産株式会社
- 斎藤洸一
Hakuhodo DY ONE
- 中原柊
2026.02.13

博報堂プロダクツによる「AIクラフトスタジオ」始動｜目指すのは、AIだからこそつくれるハイエンドなクリエイティブ
博報堂プロダクツ
2025.12.16

Prompt Engineeringは、Prompt Exploringへ　－AIとの対話が、「想像力」を超える鍵になる－【生活者インターフェース市場フォーラム2025レポート】
お笑い芸人
- 又吉直樹　氏
株式会社OpenFashion
- 上條千恵氏
AIX partner株式会社
- 野口竜司氏
博報堂
- 近山知史
2026.01.26

CES 2026をメ環研はどう見たか？【前編】 AIはスクリーンを飛び出し、現実世界へ。
博報堂
- 島野真
- 山本泰士
2025.11.19

生成AI時代のメディアの未来② 【対談】新聞社×生成AIで描く、地域の未来戦略とは
新潟日報社／新潟日報生成AI研究所
- 佐藤妙子
博報堂
- 新美妙子