Simeji for Androidのユーザー辞書をタブ区切りテキスト形式(Google, ATOK, POBoxなど)に変換する手順
Simeji for Androidからエクスポートしたユーザー辞書の形式は独自のテキスト形式で、その他の日本語入力アプリへ変換するのが難しい。ここではテキストエディタと表計算ソフトを使って多くの日本語入力アプリで採用されているタブ区切りテキスト形式への変換手順を解説します。
目次
使用するツール
- テキストエディタ(検索が出来るもの)
- 表計算ソフト(Microsoft Excel, LibreOffice CALCなど)
ここではテキストエディタとしてgPadを、表計算ソフトはExcel2013を使用しています。
なお、MacのExcelやLibreOffice等およびテキストエディタでも変換可能です。
表計算ソフトについて注意点
LibreOffice CALCやApache OpenOffice CALCでは列が1,024列しか扱えません。そのため、これから紹介する方法での変換は1,024個の単語までしか出来ません。Excel2007~2016では16,384列扱えます。
変換手順
多少くどい部分があると思いますがこまかく説明していきます。
ファイル操作の手順(1)
Simeji for AndroidからエクスポートしてPCにコピーしたユーザー辞書ファイルです。
念のためファイルを複製します。
テキストエディタでの手順(1)
テキストエディタで開きました。
まず、先頭の「{"EN_KEY":,"EN_VALUE":,"JAJP_VALUE":[」の部分を削除します。
次に検索をします。
検索文字列は「JAJP」として検索します。
単語とよみの境の部分である「],"JAJP_KEY":[」を削除します。
境の部分で改行します。
改行されました。
文末の「]}」を削除します。
ファイルを上書き保存します。
ファイル操作の手順(2)
上書きされたファイルです。
拡張子を「csv」に変更します。警告ダイアログが出てくるので「はい」をクリックします。変更したら、表計算ソフトで開いて下さい。
表計算ソフトでの手順
エクセル2013で開きました。
データ範囲を選択して下さい。A1セルを選択した状態で「Shift+Ctrl+End」を押すことで一発で選択できます。
コピーします。
セル「A4」に移動して、コンテキストメニュー(右クリック)から「形式を選択して貼り付け>行列を入れ替える」をクリックします。
行と列が入れ替わって貼り付けられました。
1~3行目は不要になったので行削除します。行番号1~3をドラッグ選択して右クリック>削除です
次にA列を選択して切り取ります。
C列を選択して、右クリックから「切り取ったセルの挿入」を選択します。
これでA列に「よみ」、B列に「単語」のシートが完成です。
ここで一端、表計算ソフトの形式で保存しておきます。(後で加工が可能なためです)
次に再度「名前を付けて保存」で「テキスト(タブ区切り) (*.txt)」で保存します。
元のファイルに上書きしないよう注意して下さい。
警告ダイアログが出ますが、「はい」をクリックして下さい。
これで保存されました。Excelを閉じて下さい。警告ダイアログは「保存しない」をクリックします。(4つ上の画像のところで既に保存してあるのでここでは保存しないでOKです)
テキストエディタでの手順(2)
さきほど保存したタブ区切りテキスト形式のファイルをテキストエディタで開きます。
文字コードが「Shift-JIS」になっていますので、変換先の日本語入力ソフトの様式に合わせて保存し直して下さい。
以上です。
補足
POBoxのユーザー辞書には「品詞」はないので、このまま文字コードと改行コードを合わせればインポートできますが、Google日本語入力(Mozc系を含む)やATOKの場合は「品詞」を追加する必要があります。その場合、Excel上のC列を編集するのが楽です。品詞を入力後にタブ区切りテキスト形式で保存して下さい。