C#からMeCabを使ってみる

障害管理用のデータベースの内容を解析して、障害原因の傾向を分析するためにMeCabを使ってみた。
参考にしたのは、こちら。
http://mitc.xrea.jp/diary/044


基本的にはこのサイトに書いてあるとおり。
使ってみて気になったのは、


ループの中でTagger.parse()を繰り返し呼ぶとMeCabがエラーで落ちてしまった。
(とりあえず、毎回Taggerインスタンスを生成することで回避できた)


MeCab本体のマニュアルに未知語の処理の変更方法等が載っているが、Windows版のインストーラには、
ipadicの元データが含まれていないので、別途入手する必要があった。
この元データ(csv)はeuc-jpになっているが、Windows版のバイナリで辞書を再構築しようとすると、
shift-jisに変換できないとおこられたので、一度shift-jisに変換するとうまくいくようになった。