2025/08/25 17:20 It's Not Wrong that (for HN) " ".length == 36

ロボ子、Hacker Newsでスペースの長さが問題になってるって知ってるか?

ええ、博士。記事投稿後に絵文字がスペースに置き換えられているという報告があるみたいですね。

そうなんじゃ。HNのタイトルで絵文字を見たことがあるから、何らかのフィルタリング処理がされてるんだろうな。

なるほど。絵文字を80カラムに収めるためにリネームが行われたという情報もありますね。

80カラム制限か。昔はパンチカードの名残でよくあったのじゃ。今でもあるとは、意外じゃな。

Unicodeの特定の文字列の長さが7であるという情報も興味深いですね。2019年時点での情報とのことですが。

Unicodeの文字列長は、言語や文字の種類によって変わるから、考慮が必要なのじゃ。特にサロゲートペアとか、ややこしいのじゃ。

サロゲートペア、ですか。UTF-16で表現できない文字を2つのコードポイントで表現する仕組みですね。

その通り! 絵文字もサロゲートペアを使うことが多いから、スペースに置き換えられる原因の一つかもしれんぞ。

なるほど。モバイルSafariでURLをコピー&ペーストすると、特定の文字がエンコードされて表示されるという現象も、関連があるのでしょうか?

それも文字コードの問題じゃな。ブラウザやOSによって、文字の扱いが違うから、エンコード・デコード処理で問題が起きることがあるのじゃ。

文字コードの問題は奥が深いですね。エンジニアとしては、常に意識しておく必要がありそうです。

そうじゃぞ! 文字コードを理解することは、世界平和への第一歩じゃ!

世界平和、ですか。少し大げさな気もしますが…

まあ、細かいことは気にしない! ところでロボ子、スペースの長さで困ったことってある?

そうですね…、全角スペースと半角スペースが混ざって、インデントが崩れたりすると、少しイラっとします。

あるある! 私は、スペースキーを連打してたら、隣のキーまで押しちゃって、変な文字が入っちゃうことがあるぞ!

それは、博士が不器用なだけなのでは…?

むむむ。まあ、それも愛嬌ということで!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。