C#からMeCabを使ってみる
障害管理用のデータベースの内容を解析して、障害原因の傾向を分析するためにMeCabを使ってみた。
参考にしたのは、こちら。
http://mitc.xrea.jp/diary/044
基本的にはこのサイトに書いてあるとおり。
使ってみて気になったのは、
ループの中でTagger.parse()を繰り返し呼ぶとMeCabがエラーで落ちてしまった。
(とりあえず、毎回Taggerのインスタンスを生成することで回避できた)
MeCab本体のマニュアルに未知語の処理の変更方法等が載っているが、Windows版のインストーラには、
ipadicの元データが含まれていないので、別途入手する必要があった。
この元データ(csv)はeuc-jpになっているが、Windows版のバイナリで辞書を再構築しようとすると、
shift-jisに変換できないとおこられたので、一度shift-jisに変換するとうまくいくようになった。