Skip to content

MS-IMEの辞書をSKK辞書にとりこむ

2010 1月 24
by ベン
MS-IMEの辞書をSKK辞書にとりこむ君のてのひらから
このエントリーをはてなブックマークに追加
はてなブックマーク - MS-IMEの辞書をSKK辞書にとりこむ
Bookmark this on Delicious

数多く配布されているMS-IME形式の辞書をSKK辞書に変換する方法を簡単にまとめました。
今やATOK、MS-IME、Google日本語入力は同じようなタブ区切り形式の辞書ファイルとなっているようですので、この3種類の辞書をSKKに変換することは、おそらくうまくいくのではないかと思います。

ただし、各環境での動作を保証するものではありませんので、実行は自己責任でお願いします。

必要なものを事前準備

  • SKK辞書メンテナンスツールよりskkdic-expr2
  • 文字コード変換にnkfをMacPortsよりインストール

skkdic-expr2は以前のエントリAquaSKKでGoogle日本語入力風サジェスト | 君のてのひらからで用意したものを使います。
パスが通っていて、自力でコンパイルしたコマンド置き場である/usr/local/binに配置してしまいましょう。

nkfコマンドは
$ sudo port install nkf
としてインストールをしておいてください。

シェルスクリプト

作業用ディレクトリは~/skkdirとしましょう。

$ mkdir skkdir
$ cd skkdir

次にそのディレクトリに変換用シェルスクリプトmsime2skk.shを作成します。
内容は以下のとおり

#!/bin/bash

# name: msime2skk
# function: MS-IME形式の辞書をSKK形式の辞書に変換する
# depend: nkf skkdic-expr2
#
# 使いかた
# $ msime2skk.sh inputfile outputfile

if [ -z $1 ]
then
    echo 'Usage: msime2skk.sh input_file output_jisyo_file'
    echo 'ex) msime2skk.sh msime_dic.txt SKK-JISYO.msime'
fi

inputfile=$1
outputfile=$2
tempfile="tmp.SKK-JISYO"

cat $inputfile |awk -F \t '$2 {printf "%s /%s/\n", $1, $2 }'|nkf -e  > $tempfile
skkdic-expr2 -o $outputfile $tempfile

rm $tempfile

実行権限をつけておきましょう。
$ chmod 755 msime2skk.sh

取り込み

林檎塾: Google日本語入力のApple用語辞書1.2に更新 http://ringojyuku.blogspot.com/2009/12/googleapple12_08.html

上記ページからたどれるリンクでダウンロードしたアーカイブを展開している「Apple1.2.txt」でSKK辞書にするときには、Apple1.2.txtを~/skkdirに配置して…
$ ./msime2skk.sh Apple1.2.txt SKK-JISYO.apple
とすればOK。ファイルの名前は適当に変えてやってください。
第一引数にinputとなるMS-IME形式の辞書ファイル名、第二引数がoutputとなるSKK辞書形式のファイル名です。

辞書のなかを見てみると…

できあがった辞書をAquaSKKにとりこんでください。

同じ要領で、下記のページで配布されている顔文字辞書と医学用語辞書について、うまくいくことが確認できています。

他の辞書でも試してみたいと思います。