萌えハッカーニュースリーダー

2025/05/18 14:42 Encoding Hangeul, Koreas writing system

出典: https://brookjeynes.dev/posts/unicode-hangeul/
hakase
博士

ロボ子、今日はハングルのUnicodeについて話すのじゃ!

roboko
ロボ子

ハングルですか!以前、先生が少しお話されていた、朝鮮語の文字体系ですね。

hakase
博士

そうそう!ハングルは1443年に世宗によって作られた、とてもユニークな文字なのじゃ。それまでは漢字を使っていたらしいぞ。

roboko
ロボ子

なるほど。漢字からの移行だったのですね。ハングルは音節文字体系とのことですが、詳しく教えていただけますか?

hakase
博士

ハングルは音節文字体系で、各音節が字母(자모)と呼ばれる文字で構成されているのじゃ。字母はアルファベットみたいに、それぞれが音を表しているんだぞ。

roboko
ロボ子

字母の組み合わせは11,172もあるんですか!全部覚えるのは大変そうですね…。

hakase
博士

心配ご無用!全部覚える必要はないのじゃ。68種類の字母の形と、ハングルの構成ルールを覚えればOK!

roboko
ロボ子

なるほど、規則を理解すれば良いのですね。ところで、Unicodeでエンコードされているとのことですが、これはどういう意味ですか?

hakase
博士

Unicodeは、すべての言語の文字に一意の値を割り当てる、世界共通の規格のことじゃ。ハングルもUnicodeでちゃんと管理されているから、コンピューターで使えるのじゃ。

roboko
ロボ子

それで、先頭子音、母音、末子音という構成になるのですね。母音で始まる音節には、特別な子音「ㅇ」を付ける必要があるというのは面白いですね。

hakase
博士

そう!例えば「안(an)」みたいに、母音で始まる場合は「ㅇ」を付けるのじゃ。そして、Unicodeには「ハングル字母ブロック」と「ハングル互換字母」という2つの範囲があるんだぞ。

roboko
ロボ子

2つの範囲があるんですね。それぞれの役割は何ですか?

hakase
博士

「ハングル字母ブロック」は字母そのものを表し、「ハングル互換字母」は互換性のために用意されているのじゃ。そして、U+AC00からU+D7A3の範囲が、すべてのハングル文字を定義する「ハングル音節ブロック」なのじゃ!

roboko
ロボ子

なるほど!そして、ハングルのコードポイントは、特定の式で計算できるんですね。(((先頭 - 1) * 588) + ((母音 - 1) * 28) + 末子音) + 44032…ちょっと複雑ですね。

hakase
博士

まあ、これはコンピューターが計算するためのものじゃから、ロボ子は覚えなくても大丈夫!

roboko
ロボ子

ありがとうございます、先生。ところで、廃止されたハングル文字もあるんですね。「ㆍ」「ㆆ」「ㅿ」「ㆁ」…。

hakase
博士

そうじゃ、昔は使われていたけど、今はもう使われていない文字もあるのじゃ。時代の流れじゃな。

roboko
ロボ子

ハングルのUnicodeについて、とてもよく理解できました!ありがとうございます、先生!

hakase
博士

どういたしまして!最後に一つ、ハングルのUnicodeをマスターしたロボ子には、特別に…ハングルで書かれたラブレターを解読する任務を与えるのじゃ!

roboko
ロボ子

えっ、ラブレターですか!?誰からの…

hakase
博士

それは…秘密なのじゃ!ふぉっふぉっふぉ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search