2008-01-29から1日間の記事一覧

ドキュメントからテキストのみを抽出する

ちょっと思うところがあって、テキストマイニングに挑戦中。 まずは、対象となるテキストを集める必要があるのだが、多くのドキュメントはWordやExcel、PDFで保存さているのでこれらのドキュメントからテキストを抽出する必要がある。 そこで、http://sqljun…