2025年12月17日水曜日

ホンの一言: 表意文字・漢字の扱い、これは英語圏AIの弱みかも?

令和8年の元旦に出す年賀状は、水彩画を挿入していたこれまでとはデザインを一新して、いま暮らしている街の風景画のカットの他は文字だけにした。

謹賀新年と令和八年元旦という文字の他は、

蛍燈映戸読書夜

雪影侵窗歳序移

だけをプリントする。あとは筆で短い文を加筆する。これからはこれで行こうと思っている。


上の七言絶句の元の詞は周知の「蛍の光」である。これをChatGPTで唐詩風に翻訳してもらった。そのうちの第1句と第2句である。第3句と第4句は

今旦啟扉辭舊室

同門握手各分離

である。これが人手を煩わせた訳であれば修正を求めるのも遠慮らしいが、AIなら簡単だ。唐詩の調べをもっと格調高く出してほしいと注文すると

螢燈照牖書聲細

雪影侵窗歲序遷

曉色啟扉辭舊舍

同遊一散各飛煙

と出してきた。第1句の 「牖」という字は日本では標準的でないが、書斎の明かりとりの小窓を指すなら「窓」ではなく「牖」である。ユウと読む。字はすべて旧字体、というか正字体を使っているのがイイ所だ。


ただ、ここまでは素晴らしいのだが、上の漢詩の第1句と第2句を年賀状のデザインに入れようと、

漢字を書道風に書いて画像ファイルにしてほしい

と求めると、これが全く使い物にならない。

そもそも、個々の漢字を同定(identify)して、その漢字を行書体なり楷書体で書いたときの画像を対応付けるという作業が出来ていないようだ。

そもそも「蛍」という感じを書き間違えて奇妙な文字を発明してしまうし、最初は横書きで作った画像を縦書きに直してくれというと、語順がメチャクチャに乱れてしまう。意味がまったく分かっていない証拠だ ― ま、それは最初から分かっていたことだが。

どうやら現行のChatGPTやCopilotは漢字を表意文字としては認識できていないのだろう。だから、 多分、漢字の認識と画像としての認識が連携できていないのだと推測している。


まだDeepseekは試していない。中国初のAIである以上、漢字処理は英語圏発のAIよりは一段レベルが上であったとしても、自国の文字である以上は当然のことである。が、やってみるまでは分からない。

結果は改めて投稿しよう。

0 件のコメント: