SAラン広域セン支の覚え書き

・ボダブレ辞書 ・各種日本語入力ソフトの辞書解説 ・実用Excel VBA

Simeji for Androidのユーザー辞書をタブ区切りテキスト形式(Google, ATOK, POBoxなど)に変換する手順

Simeji for Androidからエクスポートしたユーザー辞書の形式は独自のテキスト形式で、その他の日本語入力アプリへ変換するのが難しい。ここではテキストエディタ表計算ソフトを使って多くの日本語入力アプリで採用されているタブ区切りテキスト形式への変換手順を解説します。

目次

使用するツール

ここではテキストエディタとしてgPadを、表計算ソフトはExcel2013を使用しています。

なお、MacExcelLibreOffice等およびテキストエディタでも変換可能です。

表計算ソフトについて注意点

LibreOffice CALCやApache OpenOffice CALCでは列が1,024列しか扱えません。そのため、これから紹介する方法での変換は1,024個の単語までしか出来ません。Excel2007~2016では16,384列扱えます。

 

変換手順

多少くどい部分があると思いますがこまかく説明していきます。

ファイル操作の手順(1)

Simeji for AndroidからエクスポートしてPCにコピーしたユーザー辞書ファイルです。

f:id:dz_dzone:20170607230533j:plain

念のためファイルを複製します。

f:id:dz_dzone:20170607230803j:plain

テキストエディタでの手順(1)

テキストエディタで開きました。

f:id:dz_dzone:20170608015019j:plain

まず、先頭の「{"EN_KEY":,"EN_VALUE":,"JAJP_VALUE":[」の部分を削除します。

f:id:dz_dzone:20170608015300j:plain

次に検索をします。

f:id:dz_dzone:20170608015501j:plain

検索文字列は「JAJP」として検索します。

f:id:dz_dzone:20170608015528j:plain

単語とよみの境の部分である「],"JAJP_KEY":[」を削除します。

f:id:dz_dzone:20170608015611j:plain

境の部分で改行します。

f:id:dz_dzone:20170608015759j:plain

改行されました。

f:id:dz_dzone:20170608015840j:plain

文末の「]}」を削除します。

f:id:dz_dzone:20170608015915j:plain

ファイルを上書き保存します。

f:id:dz_dzone:20170608020117j:plain

ファイル操作の手順(2)

上書きされたファイルです。

f:id:dz_dzone:20170608020316j:plain

拡張子を「csv」に変更します。警告ダイアログが出てくるので「はい」をクリックします。変更したら、表計算ソフトで開いて下さい。

f:id:dz_dzone:20170608020414j:plain

表計算ソフトでの手順

エクセル2013で開きました。

f:id:dz_dzone:20170608020627j:plain

データ範囲を選択して下さい。A1セルを選択した状態で「Shift+Ctrl+End」を押すことで一発で選択できます。

f:id:dz_dzone:20170608020646j:plain

コピーします。

f:id:dz_dzone:20170608021300j:plain

セル「A4」に移動して、コンテキストメニュー(右クリック)から「形式を選択して貼り付け>行列を入れ替える」をクリックします。

f:id:dz_dzone:20170608021427j:plain

行と列が入れ替わって貼り付けられました。

f:id:dz_dzone:20170608021608j:plain

1~3行目は不要になったので行削除します。行番号1~3をドラッグ選択して右クリック>削除です

f:id:dz_dzone:20170608021743j:plain

次にA列を選択して切り取ります。

f:id:dz_dzone:20170608021939j:plain

C列を選択して、右クリックから「切り取ったセルの挿入」を選択します。

f:id:dz_dzone:20170608022012j:plain

これでA列に「よみ」、B列に「単語」のシートが完成です。

f:id:dz_dzone:20170608022200j:plain

ここで一端、表計算ソフトの形式で保存しておきます。(後で加工が可能なためです)

f:id:dz_dzone:20170608022341j:plain

次に再度「名前を付けて保存」で「テキスト(タブ区切り) (*.txt)」で保存します。

f:id:dz_dzone:20170617113740j:plain

元のファイルに上書きしないよう注意して下さい。

f:id:dz_dzone:20170617114116j:plain

警告ダイアログが出ますが、「はい」をクリックして下さい。

f:id:dz_dzone:20170617114345j:plain

これで保存されました。Excelを閉じて下さい。警告ダイアログは「保存しない」をクリックします。(4つ上の画像のところで既に保存してあるのでここでは保存しないでOKです)

f:id:dz_dzone:20170617114601j:plain

 

テキストエディタでの手順(2)

さきほど保存したタブ区切りテキスト形式のファイルをテキストエディタで開きます。

f:id:dz_dzone:20170617114828j:plain

文字コードが「Shift-JIS」になっていますので、変換先の日本語入力ソフトの様式に合わせて保存し直して下さい。

f:id:dz_dzone:20170617115042j:plain

以上です。

補足

POBoxのユーザー辞書には「品詞」はないので、このまま文字コードと改行コードを合わせればインポートできますが、Google日本語入力(Mozc系を含む)やATOKの場合は「品詞」を追加する必要があります。その場合、Excel上のC列を編集するのが楽です。品詞を入力後にタブ区切りテキスト形式で保存して下さい。

 

関連リンク

SIGMA 19mm F2.8 DNを買いました。……沼なの?

f:id:dz_dzone:20170527010654j:plain

広告を非表示にする

明るい単焦点レンズを買いました。

最近ずっとしまい込んでいたんですが、急にレンズが欲しくなったのです(唐突

f:id:dz_dzone:20170522211259j:plain

SONY SEL50F18 50mm F1.8です。ボディは結構前に買ったSONY NEX-5R

 

スマホを撮ってみました。

f:id:dz_dzone:20170522211619j:plain

ボケ味がよさげ。

 

うちのこかわいい

f:id:dz_dzone:20170522212611j:plain

iOSの日本語入力アプリ考 on Twitter 2015.5.20

 iOSで標準ユーザー辞書を一括登録するにはMacが必要

 母艦iTunesとの連携で単語一括登録できるが絵文字が弱いATOK

 

ATOK -日本語入力キーボード

ATOK -日本語入力キーボード

  • JUSTSYSTEMS CORPORATION
  • ユーティリティ
  • ¥1,600

なんでこんなに評価低いのかよくわからんな……w

 

バランスのいい日本語入力アプリは flick

 

 

Simejiはというと

 

Simeji - 日本語文字入力&きせかえ・顔文字キーボード

Simeji - 日本語文字入力&きせかえ・顔文字キーボード

  • Baidu Japan Inc.
  • ユーティリティ
  • 無料

 

Excel for Mac/WindowsでmacOS日本語入力プログラムの標準辞書ファイル(plist)を作成するシートを公開します

MacOS X Mabericks以降の日本語入力プログラムは、現在では単にmacOS日本語入力プログラム(Japanese Input Method)と呼称されており、Mountain Lion以前のことえりとは全く異なるものになりました。ここでは、新しい日本語入力プログラムの標準辞書の登録ファイル(プロパティリスト形式)を作成するExcelシートを公開し、その解説をします。

macOS標準辞書の登録ファイル(プロパティリスト形式)の書式

一つの単語と読みはで挟まれたセクションに記載されます。なお、品詞やコメントはありません。

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE plist PUBLIC "-//Apple//DTD PLIST 1.0//EN" "http://www.apple.com/DTDs/PropertyList-1.0.dtd">
<plist version="1.0">
<array>
	<dict>
		<key>phrase</key>
		<string>雲母坂</string>
		<key>shortcut</key>
		<string>きららざか</string>
	</dict>
</array>
</plist>

必要なソフトウェア

この変換シートはExcel VBAを使って作られています。同一シートでWindowsMacの両対応です。Windowsの場合は、直接プロパティリストファイルを作成します。Macの場合は一度新規シートにファイル内容が出力されます。それをコピーしてテキストエディタにペーストし、不要部分を正規表現置換で削除します。
なお、Windowsで変換した場合でも、Macにファイル転送して作業が必要です。

辞書ファイルを作成するExcelシート

ダウンロード

  • ExcelmacOS日本語入力プログラムのユーザー辞書ファイルを作成するシート
  • ファイル名:Excel2Plist.xlsm
  • ダウンロード:Excel2Plist.zip (zip形式圧縮)
  • 動作確認:Excel2010/2013/2016 for Windows、Excel2016 for Macで確認しています

使い方

Macの場合

任意の場所にダウンロードします。
f:id:dz_dzone:20170520215828j:plain
任意の場所に解凍して、Excel2Plist.xlsmをダブルクリックして起動します。
f:id:dz_dzone:20170520221318j:plain
マクロを有効にしてください。
f:id:dz_dzone:20170520221402j:plain
'初期設定'シートです。
f:id:dz_dzone:20170520222049j:plain
'変換元シート名'のシートに変換する辞書を入力します。A列に'読み(ひらがな)'、B列に'単語'を入力します。他のタブ区切りテキスト形式の辞書をコピー&ペーストしてきても構いません。
f:id:dz_dzone:20170520222024j:plain
用意が出来たら'初期設定'シートに戻り、'変換'ボタンを押します。
f:id:dz_dzone:20170520222049j:plain
自動的に新規シートが作成され、そのシートにプロパティリストの内容が生成されます。
f:id:dz_dzone:20170520223619j:plain
A列の一番下まで選択してコピーします。
f:id:dz_dzone:20170520224124j:plain

正規表現で置換が出来るテキストエディタ(ここではCotEditor)にペーストします。f:id:dz_dzone:20170520224440j:plain
ペーストされた状態。行頭と行末に余計なダブルクォーテーションが入ってしまっています。
f:id:dz_dzone:20170520224855j:plain
メニューバーから、'検索'>'検索'を選択します。
f:id:dz_dzone:20170520225051j:plain
'正規表現'にチェックを入れてから、検索窓に ^" と入力して、'すべて置換'をクリックします。( ^" は'行頭の"'という意味)
f:id:dz_dzone:20170520225228j:plain
行頭の'"'が削除されました。次に、検索窓に "$ と入力して、'すべて置換'をクリックします。( "$ は'行末の"'という意味)
f:id:dz_dzone:20170520225512j:plain
行末のダブルクォーテーションが削除されました。
f:id:dz_dzone:20170520225826j:plain
任意の名前で保存します。このとき、拡張子を'plist'、文字コードを'UTF-8'、改行コードを'LF'にしてください。
f:id:dz_dzone:20170520225955j:plain
f:id:dz_dzone:20170520230638j:plain
ファイルが作成されました。
f:id:dz_dzone:20170520231150j:plain

Windowsの場合

任意の場所に解凍して、ダブルクリックして起動します。
f:id:dz_dzone:20170520231753j:plain
'コンテンツの有効化'をクリックしてマクロを有効化してください。
f:id:dz_dzone:20170520232914j:plain
'変換元シート名'、'変換先ファイル名'を入力。
f:id:dz_dzone:20170520232651j:plain
'変換元シート名'のシートに変換する辞書を入力します。A列に'読み(ひらがな)'、B列に'単語'を入力します。他のタブ区切りテキスト形式の辞書をコピー&ペーストしてきても構いません。
f:id:dz_dzone:20170520233549j:plain
'初期設定'シートに戻り、'変換'をクリックします。既存のファイルがある場合は上書きされます。
f:id:dz_dzone:20170520234000j:plain
f:id:dz_dzone:20170520234646j:plain
出力されました。
f:id:dz_dzone:20170520234712j:plain
出力されたファイルは何らかの方法でMacにコピーしてください。


辞書ファイルをmacOS日本語入力プログラムに読み込む


f:id:dz_dzone:20170520231150j:plain
'システム環境設定'から'キーボード'を開き、'ユーザー辞書'タブを選択します。
f:id:dz_dzone:20170520235700j:plain
プロパティリスト形式の辞書ファイルを'ユーザー辞書'にドラッグ&ドロップします。
f:id:dz_dzone:20170520235836j:plain
'ユーザー辞書'が追加されました。
f:id:dz_dzone:20170521000214j:plain


iOS標準ユーザー辞書に同期する

iCloudを適切に設定することでMacのユーザー辞書とiOS端末のユーザー辞書が同期されます。f:id:dz_dzone:20170521000335j:plain


関連リンク

dz11.hatenadiary.jp

ユーザー辞書の一括登録方法 〜かわせみ2編〜

'かわせみ'は、老舗の日本語入力プログラム'EgBridge'(エルゴソフト)の流れをくむOS X用日本語入力アプリで、OS X ver.10.8.5 (Mountain Lion)以降は後継の'かわせみ2'となっています。この記事では、'かわせみ2'の単語登録と削除、一括登録(インポート)および書き出し(エクスポート)の方法について解説します。

www.monokakido.jp

目次

かわせみ2のユーザー辞書の登録方法

かわせみ2の単語登録の方法

単語登録/削除ウィンドウで登録する場合

IMメニューから'単語登録/削除'を選択します。(または control + F7 )

f:id:dz_dzone:20170505120144j:plain

'単語登録/削除'ウィンドウが開きました。

f:id:dz_dzone:20170505120327j:plain

'読み(ひらがな)'と'単語'を入力し、'品詞'を選択して、'登録'をクリックします。。任意で'コメント'の入力も可能です。

f:id:dz_dzone:20170505120636j:plain

単語が登録されました。

f:id:dz_dzone:20170505120734j:plain

辞書管理ツールで登録する場合

IMメニューから'辞書管理ツール'を選択します。

f:id:dz_dzone:20170505123550j:plain

'辞書管理ツール'が開きました。'登録'アイコンをクリックします。

f:id:dz_dzone:20170505123612j:plain

'読み(ひらがな)'と'単語'を入力し、'品詞'を選択して、'登録'をクリックします。。任意で'コメント'の入力も可能です。

f:id:dz_dzone:20170505123719j:plain

 

かわせみ2の単語削除の方法

'辞書管理ツール'を開きます。 削除したい単語を選択してから'削除'アイコンをクリックします。

f:id:dz_dzone:20170505124254j:plain

確認ダイアログが出るので、'削除'をクリックします。

f:id:dz_dzone:20170505124422j:plain

単語が削除されました。

f:id:dz_dzone:20170505124521j:plain

 

かわせみ2のユーザー辞書の一括登録(インポート)の方法

'辞書管理ツール'を開き、'ファイル'メニューから'辞書/テキストの読み込み'を選択します。

f:id:dz_dzone:20170505125006j:plain

辞書ファイルを選択して'開く'をクリックします。

f:id:dz_dzone:20170505125818j:plain

登録確認画面が出ますので、'閉じる'をクリックします。

f:id:dz_dzone:20170505125903j:plain

単語が一括登録(インポート)されました。

f:id:dz_dzone:20170505125915j:plain

なお、読み込み(インポート)できる形式は以下の通り。

上の3つは一般的なタブ区切りテキストファイル形式、4番目はコンマ区切りテキストファイル形式、5番目は拡張子が*.plistのXMLファイル形式です。

なお、plist形式には品詞の情報がついていません。全て名詞扱いとなります。

 

かわせみ2のユーザー辞書の書き出し(エクスポート)の方法

'辞書管理ツール'を開き、'ファイル'メニューから'テキストに書き出し'を選択します。

f:id:dz_dzone:20170505174649j:plain

保存するファイルの名前を入力し、保存場所を選択します。また、出力形式および出力対象を選択してから、'保存'をクリックします。

f:id:dz_dzone:20170505174736j:plain

書き出し(エクスポート)が完了しました。

f:id:dz_dzone:20170505174928j:plain

出力されたファイルです。

f:id:dz_dzone:20170505175200j:plain

 

関連リンク

ユーザー辞書の一括登録方法 〜Baidu IME編〜

Windows用日本語入力ソフトのBaidu IMEのユーザー辞書の単語登録と削除、一括登録(インポート)および書き出し(エクスポート)の方法を解説します。

目次

Baidu IMEのユーザー辞書の登録方法

'あ'のところで右クリックしてメニューを出します。

f:id:dz_dzone:20170505011047j:plain

'ユーザー辞書'をクリックします。

f:id:dz_dzone:20170505011101j:plain

ユーザー辞書が開きました。

f:id:dz_dzone:20170505011223j:plain

 

Baidu IMEの単語登録の方法

'追加'をクリックします。

f:id:dz_dzone:20170505011223j:plain

'単語'と'読み(ひらがな)'を入力し、'品詞'を選択してから、'登録'をクリックします。

f:id:dz_dzone:20170505011308j:plain

単語が登録されました。

f:id:dz_dzone:20170505011444j:plain

 

Baidu IMEの単語削除の方法

単語を選択してから、'削除'をクリックします。

f:id:dz_dzone:20170505011524j:plain

確認ダイアログが出るので、'OK'をクリックします。

f:id:dz_dzone:20170505011548j:plain

単語が削除されました。

f:id:dz_dzone:20170505011758j:plain

 

Baidu IMEのユーザー辞書の一括登録(インポート)の方法

 '管理'メニューから'テキストファイルをインポート'を選択します。

f:id:dz_dzone:20170505011847j:plain

Baidu IME用の辞書ファイル(タブ区切りテキストファイル/UTF-16/LF)を開きます。f:id:dz_dzone:20170505011929j:plain

辞書が登録されました。

f:id:dz_dzone:20170505012128j:plain

 

Baidu IMEのユーザー辞書の書き出し(エクスポート)の方法

'管理'メニューから'テキストファイルにエクスポート'を選択します。

f:id:dz_dzone:20170505012328j:plain

任意のフォルダに'保存'します。

f:id:dz_dzone:20170505012529j:plain

エクスポートが完了しました。

f:id:dz_dzone:20170505012705j:plain

エクスポートされたテキストファイルがこちらです。

f:id:dz_dzone:20170505012647j:plain

 

他の日本語入力ソフトへのコンバートについて

主要な日本語入力ソフトの辞書と同様のタブ区切りテキストファイル形式の辞書ファイルです。この形式ですと、簡単な加工で他の日本語入力ソフトの辞書に変換することが可能です。 (例:MS-IME, ATOK, Google日本語入力)

 

以上です。