MeCab説明書きの写経 (1)
さて、取得したテキストの解析にあたって、MeCab/CaboChaで実際にどういうことが出来るのかしらということで、MeCabとCaboChaの説明書きを写経 & まとめてみた
- http://mecab.sourceforge.net/
- Google Code Archive - Long-term storage for Google Code Project Hosting.
まずはMeCabから。
MeCabはオープンソースの形態素解析エンジン.パラメータの推定に Conditional Random Fields (CRF) を用いている、とか。CRF++を用いて、辞書スコアなどの学習ができる?とかなんとかはこれから読む。
形態素解析は
形態素解析とは、自然言語で書かれた文を形態素(Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの品詞を判別する作業を指す。
wikipedia 形態素解析