about MeCab (3) 品詞IDの指定

品詞を品詞名で出力するのではなく、品詞IDを指定してそれを出力することが出来る
http://mecab.sourceforge.net/posid.html

定義した品詞IDは出力時に%hを指定することで参照される

% mecab -F"%m\t%h\n" -E"EOS\n"

品詞IDの定義

pos-id.defを編集する。
形式

マッチパターン  ID

マッチパターンの記述

*: すべての文字列にマッチ
(AB|CD|EF): AB もしくは CD もしくは EF にマッチ
AB: 文字列 AB のみに完全マッチ

pos-id を変更したら, 辞書をリコンパイルする必要があります.

/usr/local/libexec/mecab/mecab-dict-index

定義例

単純な例

名詞 1
動詞 2
形容詞 3
副詞 4
助詞 5
接続詞 6
助動詞 7
連体詞 8
感動詞 9
* 10
ちょっと複雑な例

名詞 1
(助詞|助動詞) 2
(副詞|形容詞|連体詞) 3

* 4

もっと複雑な例

その他,間投,*,* 0
フィラー,*,*,* 1
感動詞,*,*,* 2
記号,アルファベット,*,* 3
記号,一般,*,* 4
記号,括弧開,*,* 5
記号,括弧閉,*,* 6
記号,句点,*,* 7
記号,空白,*,* 8
記号,読点,*,* 9
形容詞,自立,*,* 10
形容詞,接尾,*,* 11
形容詞,非自立,*,* 12
助詞,格助詞,一般,* 13
助詞,格助詞,引用,* 14
助詞,格助詞,連語,* 15
助詞,係助詞,*,* 16
助詞,終助詞,*,* 17
助詞,接続助詞,*,* 18
助詞,特殊,*,* 19

定義例をもっと