2019年8月18日日曜日

UbuntuにRMecabをインストールする

あまプロではRを使ってテキストマイニングの授業を行う事が有ります。

先日、生徒さんへRの環境構築を教えた際にハマりポイントが有りましたのであメログ。

Ubuntu19.04では以下のコマンドでR言語とmecabをインストール出来ます。
sudo apt install r-base mecab
確認
R --version
R version 3.5.2 (2018-12-20) -- "Eggshell Igloo"
Copyright (C) 2018 The R Foundation for Statistical Computing
Platform: x86_64-pc-linux-gnu (64-bit)

R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under the terms of the
GNU General Public License versions 2 or 3.
For more information about these matters see
http://www.gnu.org/licenses/.
現時点の最新版(3.6.1)やないけどまぁ良ぇわ
続いて確認
mecab --version
mecab of 0.996
これでRとMecabをインスール出来ます。
最後にRからMecabを利用する為に、RMecabをインストールします。
Rを起動して
R
R上でRMecabをインストールします。
install.packages("RMeCab", repos = "http://rmecab.jp/R", type = "source")
なんですが、私の環境では下記のエラーが出ました。
/usr/bin/ld: -lmecab が見つかりません
collect2: error: ld returned 1 exit status
make: *** [/usr/share/R/share/make/shlib.mk:6: RMeCab.so] エラー 1
ERROR: compilation failed for package ‘RMeCab’
* removing ‘/home/masayuki/R/x86_64-pc-linux-gnu-library/3.5/RMeCab’

 ダウンロードされたパッケージは、以下にあります
     ‘/tmp/RtmpZVhDFY/downloaded_packages’
 警告メッセージ:
 install.packages("RMeCab", repos = "http://rmecab.jp/R", type = "source") で:
   パッケージ ‘RMeCab’ のインストールは、ゼロでない終了値をもちました
mecabをインストールしたのにmecabが見付からへんと言うております。
どうやらRからmecabを参照出来てへん様です。
探してみます。
locate mecab
/usr/lib/x86_64-linux-gnu/libmecab.so.2
/usr/lib/x86_64-linux-gnu/libmecab.so.2.0.0
有るやんけ
なもんで、リンボリックリンクを作って参照を追加したります。
sudo ln -s /usr/lib/x86_64-linux-gnu/libmecab.so.2 /usr/lib/x86_64-linux-gnu/libmecab.so
こんだけ
再度、R上からRMecabをインストール。
install.packages( "RMeCab", repos = "http://rmecab.jp/R", type = "source")

installing to /home/masayuki/R/x86_64-pc-linux-gnu-library/3.5/RMeCab/libs
** R
** byte-compile and prepare package for lazy loading
** help
*** installing help indices
** building package indices
** testing if installed package can be loaded
* DONE (RMeCab)

 ダウンロードされたパッケージは、以下にあります
     ‘/tmp/RtmpH1Viwj/downloaded_packages’
今度は上手いこと行けました。
library( RMeCab)
ライブラリを追加して、
unlist( RMeCabC( "すもももももももものうち"))
    名詞     助詞     名詞     助詞     名詞     助詞     名詞
"すもも"     "も"   "もも"     "も"   "もも"     "の"   "うち"
正しく品詞を解析出来てます。

RとMecabを用いると日本語アンケートの解析とかが出来る様になるんで便利です。

0 件のコメント:

コメントを投稿

つっこみ