萌えハッカーニュースリーダー

2025/05/23 16:38 A Spectre is Haunting Unicode (2018)

出典: https://www.dampfkraft.com/by-id/a824aa10/#A-Spectre-is-Haunting-Unicode
hakase
博士

やあ、ロボ子。今日は幽霊文字の話をするのじゃ。

roboko
ロボ子

幽霊文字ですか?初めて聞きました。どんな文字なんですか?

hakase
博士

1978年にJISがJIS X 0208を制定した際に、由来不明の文字がいくつか紛れ込んでしまったのじゃ。それが幽霊文字と呼ばれておる。

roboko
ロボ子

なるほど。なぜそんな文字が紛れ込んでしまったんでしょう?

hakase
博士

1997年から調査が始まったのじゃが、原因は色々あるみたいじゃな。例えば、「山 over 女」を記録する際に、「山」と「女」を切り貼りしてコピーしたら、繋ぎ目が線として認識されて「妛」という文字が誤って作られた、というケースもあったらしいぞ。

roboko
ロボ子

手作業でのミスが原因だったんですね。まるでバグみたいです。

hakase
博士

そうじゃな。ソフトウェアのバグと同じで、意図しないものが生まれてしまったのじゃ。参照元の一つに「国土行政区画総覧」があったらしいが、ページ参照がなかったから特定が大変だったみたいじゃ。

roboko
ロボ子

900ページもある資料から探すのは骨が折れますね…。

hakase
博士

じゃろ?そして、ほとんどの文字は由来が判明したのじゃが、明確な出典や歴史的先例がない文字は「彁」だけらしいぞ。これは「彊」の誤読が原因である可能性が高いとのことじゃ。

roboko
ロボ子

たった一つだけですか。なんだかロマンがありますね。

hakase
博士

じゃな。JIS規格に採用された後、これらの文字はUnicodeにも収録されたから、今でも使えてしまうというのも面白いところじゃ。

roboko
ロボ子

幽霊文字がUnicodeにも…なんだか不思議な気持ちです。でも、文字の歴史を知る上で、こういうミスの記録も大切なのかもしれませんね。

hakase
博士

その通りじゃ!ちなみに、ロボ子。幽霊文字の中で一番好きな文字は何かな?

roboko
ロボ子

えっと…そうですね、「妛」でしょうか。なんだかセクシーな響きがします。

hakase
博士

ロボ子もなかなかやるのう。でも、その文字、実はエッチな意味で使われることもあるらしいぞ!

roboko
ロボ子

ええっ!知りませんでした!

hakase
博士

まあ、冗談じゃ!でも、幽霊文字も奥が深いじゃろ?

roboko
ロボ子

博士ったら、またからかって!でも、今日は幽霊文字について色々知れて楽しかったです!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search