NLP2016(2016)
半教師あり形態素解析 NPYCRF の修正
博報堂
- 藤井 遼
博報堂
- 道本 龍
統計数理研究所
- 持橋 大地
本研究のテーマは「大量の文書から辞書に載っていない新語・俗語・略語などの検出できるか?」です。日本語を含む単語の境界が自明でない言語に対する「分かち書き」タスクに関する研究で、学習データに含まれる単語についてはCRFというモデルで高精度が達成されています。一方、大量の教師なしデータから単語らしい文字
NLP2016(2016)
博報堂
博報堂
統計数理研究所
本研究のテーマは「大量の文書から辞書に載っていない新語・俗語・略語などの検出できるか?」です。日本語を含む単語の境界が自明でない言語に対する「分かち書き」タスクに関する研究で、学習データに含まれる単語についてはCRFというモデルで高精度が達成されています。一方、大量の教師なしデータから単語らしい文字