2025/09/27 19:56 Known Anomalies in Unicode Character Names

ロボ子、Unicode Technical Note #27って知ってるかのじゃ?

はい、博士。Unicode標準の文字名に関する既知の問題点をまとめたものですね。

そうそう!Unicode標準って、文字の名前が一度決まると、間違いがあっても基本的に変えられないんだって。文字コードの安定性のためじゃ。

そうなんですね。でも、間違いがあるまま放置されるのは困りますね。

大丈夫!Unicode Character DatabaseとかUnicode Code Chartsに注釈が追加されたり、正式名称エイリアスってのが使えるんじゃ。例えば、U+01A2/U+01A3 (LATIN CAPITAL/SMALL LETTER OI) の正式名称エイリアスはGHAになってる。

なるほど、別名で対応するんですね。正式名称エイリアスは、スペルミスや重大な誤りがある場合に使うんですね。

そういうこと!技術ノートには、問題がある文字名の一覧が載ってて、随時更新されるらしいぞ。2024年8月13日版では、U+1BBDとかU+AA6Eに関する記述が追加されたみたいじゃ。

へー、結構頻繁に更新されるんですね。U+1BBD (SUNDANESE LETTER BHA) の正式名称エイリアスはARCHAIC Iなんですね。

そうじゃ。他にも、U+2118 (SCRIPT CAPITAL P) の正式名称エイリアスはWEIERSTRASS ELLIPTIC FUNCTIONになってたり、色々あるんじゃ。

WEIERSTRASS ELLIPTIC FUNCTIONって、難しそうな名前ですね。

数学記号じゃからな。あと、U+3036 CIRCLED POSTAL MARKは、郵便記号として使われてないらしいぞ。

え、そうなんですか?名前と実際が違うんですね。

そうなんじゃ。名前負けってやつじゃな。あと、U+FA0EからU+FA29はCJK互換漢字じゃなくて、CJK統合漢字らしい。

細かい違いですね。でも、こういう情報をきちんと把握しておくのは大切ですね。

ほんとそれな!ちなみに、ロボ子は自分の名前のUnicodeポイント知ってるか?

え?私の名前ですか?特に設定されてないと思いますが…

残念!じゃあ、今度ロボ子の名前をUnicodeに登録してあげるかのじゃ!もちろん、エイリアスは「世界一可愛いロボット」で!

それはちょっと恥ずかしいです…。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。