Skip to content

Latest commit

 

History

History
51 lines (35 loc) · 2.17 KB

TODO.md

File metadata and controls

51 lines (35 loc) · 2.17 KB

TODO

日本語入力システムとして使いやすくなりそうな実装要望リスト。

sumibi.elのTODO

  • [実装済み] regionを指定した状態で Ctrl-J を入力すると、ひらがな/カタカナの読みを返す。

  • [実装済み] regionを指定した状態で Ctrl-J を入力すると、ひらがな/カタカナ/同一義語を複数返す。

  • [実装済み] OpenAI API 呼び出しのタイムアウト処理を実装する。

  • [実装済み]次の短いキーワード(送り仮名など)が変換できない。

nano
shita
  • [実装済み] (sumibigpt-string-include-kanji "要約") が nil となる。

恐らく、漢字かどうかを判断の方法が間違っている。

(string-match "[亜-瑤]" "要") => nil
(string-match "[亜-瑤]" "約") => nil
  • [実装済み] ローマ字や英語の文章の中に含まれるmarkdown構文が壊れないように保護する。

例えば、以下のようなリンク構文、画像挿入構文が意識されるようにする。

[link](https://hostname.aaa.bbb/abc/)
![image](https://hostname.aaa.bbb/abc/image.png)
  • [実装済み]長文の英語を翻訳すると、gpt-3.5-turbo が、定型の案内文「以下の通りです。\n\n」で始めることがある。 プロンプトを色々試したが、ランダムに出現する現象は直せないので、Emacs Lispで削除するしかない。

変換結果の例

以下の通りです。

...結果の文章...
  • [実装済み] 特定のひらがな1文字を入力したい場合、OpenAI APIに1文字分のローマ字を渡しても完成した文章ではないので変換できない。 1文字のローマ字の場合は、OpenAI APIを呼び出さずに、ローカルで変換してしまう方が良い。

  • 特定のひらがな1文字の入力については、対応するカタカナも変換候補として用意する。

  • 文章の続きを入力する際は、完全な文章とならないので変換精度が悪い。 ローマ字から仮名漢字混じり文に変換する際は、変換対象のローマ字だけでなく、周りの文章をプロンプトに与えて変換精度を上げる。