NEologd Casual Talks #neologd 参加レポート
IT系勉強会ウォッチャーの川崎です。2016年4月26日(火)に開催された NEologd Casual Talks #neologd に参加してきたのでイベントの様子をご紹介いたします。
イベント内容
NEologdは、形態素解析のための新語辞書で、作者が新語の定期更新をされています。今回のイベントはNEologdの公開から1年を機に開催されました。
MeCab 用の新語辞書 mecab-ipadic-neologd を公開しました
会場は渋谷ヒカリエのLINEさんでした。
NEologdをどう使うと便利なのか ークエリ拡張における活用 by @Quasi_quant2010
LT2本から本イベントが始まりました。最初は@Quasi_quant2010さんの「NElogdをどう使うと便利なのか ー クエリ拡張における活用」というLTでした。NEologdを使って、ユーザーの検索意図を保ちつつ、検索漏れを防ぐ方法を提案されてました。
テキスト前処理用Pythonモジュールneologdnの紹介 by @_yukinoi
続いて、@_yukinoiさんのLTです。テキスト前処理用のPythonモジュールを作成した話です。例えば、「ウェーーーーイ」と「ウェーイ」を同じ言葉として扱うために前処理が必要で、そのためのモジュールを作成した、という内容でした。
ファッションを扱うサービスのために、Elasticsearchのユーザー辞書とシノニム辞書を作った話 by @sinamon129
続いて、メイントークの1本目は@sinamon129さんの「ファッションを扱うサービスのために、Elasticsearchのユーザー辞書とシノニム辞書を作った話」でした。発表後の質疑応答では、 辞書の移行前と移行後の比較で、検索ログの上位から何千件をチェックされてるとのことで、 件数の多さに質問者の方が驚いておられました。
知識を紡ぐための言語処理と、そのための言語資源 by @conditional
メイントークの2本めの@conditionalさんは、東北大学で自然言語処理の研究室に所属されていて、 スタッフだけでも13名、という大所帯の研究室でした。 自然言語の最近の取り組みを紹介されていて、非常に興味深い内容でした。
NEologdが2016年末までにやること by @overlast
本日最後の発表は、NEologd作者で本イベントの主催者、@overlastこと佐藤さんでした。佐藤さんからは、mcab-ipadic-NEologdの今後の予定ということで、
- 動詞エントリの拡張
- 略語エントリの追加
- 新語の追加
を挙げておられました。上の2つは、主に佐藤さんが担当され、3つ目の新語の追加はコミュニティでできるようにするということで、こちらのgithubのリポジトリをご紹介いただきました。
https://github.com/neologd/ext-column-unidic-tokenized-surface
まとめ
質問者の所属から察するに、自然言語処理の実務者の方が多数集まったイベントだった気がします。NEologdの今後に期待したいと思います。