Mecabでキーワード自動リンク(Python編)

ウノウラボ Unoh Labs: PHPとMecabでキーワード自動リンクを実装する

上記の記事ではPHPでの使い方を紹介しましたが、もちろんPythonでも簡単にできます。1.mecabインストールと2.自動リンク用辞書の作成は、同じなのでここでは省略します。

3.Mecabモジュールのインストール

# yum install python-mecab

はい、完了。

4.動作確認

次のようなプログラムを書いて実行します。

import MeCab

t = MeCab.Tagger("-d /usr/lib/mecab/autolink")
str = '京都についてGoogleとYahooで検索した。'

print t.parse(str)

実行結果

$ python autolink.py
<a href="http://www.city.kyoto.jp/">京都</a>について
<a href="http://www.google.com/">Google</a>と
<a href="http://www.yahoo.com/">Yahoo</a>で検索した。

このようにPHPと同じかそれ以上にとても簡単です。
Pythonの場合は、他にTernary Search Tree(TST)のデータ構造を利用したpytstもあるのですが、日本語のことを考えるとMecabかDartsのほうが安心かと。

また、さらなる高速化を追い求める人は、 cmecab -- Mecab-Python高速バインディング というのもあるので、こちらも試してみると楽しいかもしれません。



このエントリーのはてなブックマーク (-)