KH Coderへの医療用語辞書導入の方法 #1258
-
お使いのKH Coderのバージョン ■お使いのOS 先生のtwitterを拝見させて頂き、それを基に行ったのですが、エラーメッセージが出て作動しませんでした。 ![]() |
Beta Was this translation helpful? Give feedback.
Replies: 3 comments 4 replies
-
「システム辞書」と「ユーザー辞書」MeCabの辞書には2種類あるようです。UniDicはすべての単語を入れかえる「システム辞書」です。それに対して「Mecab用辞書データ J-MedDic for MeCab」は、もともとの辞書の内容はそのまま使い、そこへ医療用語を追加する「ユーザー辞書」です。辞書の種類が違いますので、設定方法もだいぶ変わってきます。 したがって、まずは加えた変更をすべてもとに戻してください。もとに戻すことが難しい場合は、一度アンインストールして、インストールし直すのが確実かと思います。もしmecabrcのみ編集されている場合については、後掲のmecabrcをお使いいただけば、インストールし直しの必要はないと思います。 「ユーザー辞書」の保存「Mecab用辞書データ J-MedDic for MeCab」をダウンロード・解凍して、すべてのファイルを C:\KHCoderOfficialPackage\dep フォルダへコピーします。 「ユーザー辞書」を利用するようMeCabを設定「ユーザー辞書」をMeCabが使えるように、C:\KHCoderOfficialPackage\dep\mecab\etc\mecabrc に次のような行を加えます。
この変更加えたmecabrcファイルをここに置いておきます。 ただしこれで一応、百薬辞書・万病辞書を使えるようになります。ただ、ぱっと見た限りでも若干の副作用があるように見えます。
なので、「か」を省いたり、「へんずつう/icd=G439/freq=85-90%/片頭痛」を「片頭痛」に短縮するといった編集を加えたバージョンを作れば良いのかなと、素人的には思います。ここで「icd=G439」「freq=85-90%」のような情報は残すべき有用なものだったりしますでしょうか? また3.や4.のような語は、万病辞書から削除してしまって差し支えないでしょうか。 |
Beta Was this translation helpful? Give feedback.
-
作ってみました「万病辞書データ」および「百薬辞書データ」をもとに、KH Coder(MeCab)で使いやすいであろう形式の医療用語辞書を作ってみました。よろしかったらお試しください。 私が手を加えたのは以下の点です。
使用法
もしKH Coderのインストール先がC:\KHCoderOfficialPackageではない場合、インストール先に合わせて修正してください。
解析例たとえば次のような解析結果となります。 「抗生剤」「抗生物質」などの基本形が「抗生物質製剤」となっています。 ライセンスについて「万病辞書データ」および「百薬辞書データ」は、奈良先端科学技術大学院大学 ソーシャル・コンピューティング研究室によって開発・公開されたものです。 クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。 次の免責事項が表示されています。
|
Beta Was this translation helpful? Give feedback.
-
改善版を作成しました「万病辞書データ」と「百薬辞書データ」に加えて、「ComeJisyo」を使わせていただいて、KH Coder(MeCab)で利用しやすいと考えられる医療用語辞書を作ってみました。もしよろしかったらご利用ください。 使用法
もしKH Coderのインストール先がC:\KHCoderOfficialPackageではない場合、インストール先に合わせて修正してください。
前のバージョンからアップデートする場合は、辞書ファイル(*.dicファイル)を今回のもので上書きしてください。またmecabrcについては、前回加えた「userdic = 」で始まる行を削除して、かわりに今回の行を加えてください。 手を加えた点以下の点は以前と同様です。
今回の変更は以下の通りです。
解析例ライセンス「万病辞書データ」および「百薬辞書データ」は、奈良先端科学技術大学院大学 ソーシャル・コンピューティング研究室によって開発・公開されたものです。 クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。 次の免責事項が表示されています。
ComeJisyoのライセンスは、
とのことです。したがって無保証です。そのほかに、「本辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記」することが要請されています。 |
Beta Was this translation helpful? Give feedback.
改善版を作成しました
「万病辞書データ」と「百薬辞書データ」に加えて、「ComeJisyo」を使わせていただいて、KH Coder(MeCab)で利用しやすいと考えられる医療用語辞書を作ってみました。もしよろしかったらご利用ください。
使用法
こちらのZipファイル内の辞書ファイル(*.dicファイル)を、kh_coder.exeと同じ場所の「dep」フォルダ内においてください。
mecab_medical_dics_kh2.zip
kh_coder.exeがある場所から「dep」「mecab」「etc」とフォルダをたどり、「mecabrc」ファイルをテキストエディタで開き、次の1行を加えてください。
もしKH Coderのインストール先がC:\KHCoderOfficialPackageではない場合、インストール先に合わせて修正してください。
前のバージョンからアップデートする場合は、辞書ファイル(*.dicファイル)を今回のもので上書きしてください。またmecabrcについては、前回加えた「userdic = 」で始まる行を削除して、かわりに今回の行を加えてください。
手を加えた点
以下の…