mecab with python-bindingでのメソッド
実のところ、pythonから使うのにあたっては、出力を定義するのではなく、メソッドでそれぞれの値にアクセスするのではなかったのか、って言う…。
import MeCab txt = u"好きとか好きとか伝えたい".encode('utf8') m = MeCab.Tagger("-Omerymo") print m.parse(txt) 好き,4,動詞,*,*,*,*,*,○,○,○,, とか,17,助詞,終助詞,*,*,*,*,な,ナ,ナ,, ... n = m.parseToNode(txt) dir(n) ...
メソッドとその説明
- prev
- 一つ前の形態素へのポインタ
- next
- 一つ先の形態素へのポインタ
- enext
- 同じ位置で終わる形態素へのポインタ
- bnext
- 同じ開始位置で始まる形態素へのポインタ
- feature
- CSV で表記された素性情報
- length
- 形態素の長さ
- rlength
- 形態素の長さ(先頭のスペースを含む)
- rcAttr
- 右文脈 id
- lcAttr
- 左文脈 id
- posid
- 形態素 ID (未使用)
- char_type
- 文字種情報
- stat
- 形態素の種類: 以下のマクロの値
- #define MECAB_NOR_NODE 0
- #define MECAB_UNK_NODE 1
- #define MECAB_BOS_NODE 2
- #define MECAB_EOS_NODE 3
- isbest
- ベスト解の場合 1, それ以外 0
- alpha
- forward backward の foward log 確率
- beta
- forward backward の backward log 確率
- prob
- 周辺確率
- alpha, beta, prob は -l 2 オプションを指定した時に定義されます
- wcost
- 単語生起コスト
- cost
- 累積コスト
- sentence_length
- ] : (要確認)解析対象文章の長さ? BOS nodeのみ?
- begin_node_list
- なんだろ?
- end_node_list
- なんだろ?
- lpath
- なんだろ?
- rpath
- なんだろ?
- this
- なんだろ?
- token
- なんだろ?