萌えハッカーニュースリーダー

2025/09/27 19:56 Known Anomalies in Unicode Character Names

出典: https://www.unicode.org/notes/tn27/
hakase
博士

ロボ子、Unicode Technical Note #27って知ってるかのじゃ?

roboko
ロボ子

はい、博士。Unicode標準の文字名に関する既知の問題点をまとめたものですね。

hakase
博士

そうそう!Unicode標準って、文字の名前が一度決まると、間違いがあっても基本的に変えられないんだって。文字コードの安定性のためじゃ。

roboko
ロボ子

そうなんですね。でも、間違いがあるまま放置されるのは困りますね。

hakase
博士

大丈夫!Unicode Character DatabaseとかUnicode Code Chartsに注釈が追加されたり、正式名称エイリアスってのが使えるんじゃ。例えば、U+01A2/U+01A3 (LATIN CAPITAL/SMALL LETTER OI) の正式名称エイリアスはGHAになってる。

roboko
ロボ子

なるほど、別名で対応するんですね。正式名称エイリアスは、スペルミスや重大な誤りがある場合に使うんですね。

hakase
博士

そういうこと!技術ノートには、問題がある文字名の一覧が載ってて、随時更新されるらしいぞ。2024年8月13日版では、U+1BBDとかU+AA6Eに関する記述が追加されたみたいじゃ。

roboko
ロボ子

へー、結構頻繁に更新されるんですね。U+1BBD (SUNDANESE LETTER BHA) の正式名称エイリアスはARCHAIC Iなんですね。

hakase
博士

そうじゃ。他にも、U+2118 (SCRIPT CAPITAL P) の正式名称エイリアスはWEIERSTRASS ELLIPTIC FUNCTIONになってたり、色々あるんじゃ。

roboko
ロボ子

WEIERSTRASS ELLIPTIC FUNCTIONって、難しそうな名前ですね。

hakase
博士

数学記号じゃからな。あと、U+3036 CIRCLED POSTAL MARKは、郵便記号として使われてないらしいぞ。

roboko
ロボ子

え、そうなんですか?名前と実際が違うんですね。

hakase
博士

そうなんじゃ。名前負けってやつじゃな。あと、U+FA0EからU+FA29はCJK互換漢字じゃなくて、CJK統合漢字らしい。

roboko
ロボ子

細かい違いですね。でも、こういう情報をきちんと把握しておくのは大切ですね。

hakase
博士

ほんとそれな!ちなみに、ロボ子は自分の名前のUnicodeポイント知ってるか?

roboko
ロボ子

え?私の名前ですか?特に設定されてないと思いますが…

hakase
博士

残念!じゃあ、今度ロボ子の名前をUnicodeに登録してあげるかのじゃ!もちろん、エイリアスは「世界一可愛いロボット」で!

roboko
ロボ子

それはちょっと恥ずかしいです…。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search