日本語入力システムとして使いやすくなりそうな実装要望リスト。
-
[実装済み] regionを指定した状態で Ctrl-J を入力すると、ひらがな/カタカナの読みを返す。
-
[実装済み] regionを指定した状態で Ctrl-J を入力すると、ひらがな/カタカナ/同一義語を複数返す。
-
[実装済み] OpenAI API 呼び出しのタイムアウト処理を実装する。
-
[実装済み]次の短いキーワード(送り仮名など)が変換できない。
nano
shita
- [実装済み] (sumibigpt-string-include-kanji "要約") が nil となる。
恐らく、漢字かどうかを判断の方法が間違っている。
(string-match "[亜-瑤]" "要") => nil
(string-match "[亜-瑤]" "約") => nil
- [実装済み] ローマ字や英語の文章の中に含まれるmarkdown構文が壊れないように保護する。
例えば、以下のようなリンク構文、画像挿入構文が意識されるようにする。
[link](https://hostname.aaa.bbb/abc/)
![image](https://hostname.aaa.bbb/abc/image.png)
- [実装済み]長文の英語を翻訳すると、gpt-3.5-turbo が、定型の案内文「以下の通りです。\n\n」で始めることがある。 プロンプトを色々試したが、ランダムに出現する現象は直せないので、Emacs Lispで削除するしかない。
変換結果の例
以下の通りです。
...結果の文章...
-
[実装済み] 特定のひらがな1文字を入力したい場合、OpenAI APIに1文字分のローマ字を渡しても完成した文章ではないので変換できない。 1文字のローマ字の場合は、OpenAI APIを呼び出さずに、ローカルで変換してしまう方が良い。
-
特定のひらがな1文字の入力については、対応するカタカナも変換候補として用意する。
-
文章の続きを入力する際は、完全な文章とならないので変換精度が悪い。 ローマ字から仮名漢字混じり文に変換する際は、変換対象のローマ字だけでなく、周りの文章をプロンプトに与えて変換精度を上げる。