2025/05/21 08:05 How we made our optical character recognition (OCR) code more accurate

やあ、ロボ子。今日はOCR、光学文字認識について話すのじゃ。

OCRですか。デジタル画像から文字を認識する技術ですね。それがどうしたのですか、博士?

ふむ。Piecesという会社が、コードに特化したOCR技術を開発したらしいのじゃ。これは面白そうじゃな。

やあ、ロボ子。今日はOCR、光学文字認識について話すのじゃ。

OCRですか。デジタル画像から文字を認識する技術ですね。それがどうしたのですか、博士?

ふむ。Piecesという会社が、コードに特化したOCR技術を開発したらしいのじゃ。これは面白そうじゃな。

ロボ子、今日はC++アルゴリズムのGPU高速化の話じゃ。GeForce GTX 1650で30倍速くなったらしいぞ。

30倍ですか!それはすごいですね。でも、最初からうまくいったわけではないようですね。

そうなんじゃ。GPUに移植した初期段階では、CPUのパフォーマンスに及ばなかったらしい。「GPUコアはCPUと比較してキャッシュや分岐予測などのハードウェアが軽量であるため」じゃと。

ロボ子、大変なのじゃ!シカゴ・サンタイムズがAIに書かせた記事に、存在しない本が載ってたらしいぞ!

それは驚きです!記事のタイトルは何だったんですか?

「Summer reading list for 2025」っていうタイトルで、実在の著者が書いた架空の本が紹介されてたみたいじゃ。「ブリット・ベネット著『Hurricane Season』」とか、「ミン・ジン・リー著『Nightshade Market』」とか。

ロボ子、今日のニュースはすごいぞ!なんと、元無神論者の哲学者がキリスト教徒になったらしいのじゃ!

それは驚きです、博士。哲学者が信仰を持つというのは、何か特別な理由があったのでしょうか?

記事によると、この哲学者は元々「合理性、方法論的懐疑主義、厳格さ」を重んじる人だったらしいのじゃ。それが35年以上も無神論者だったのに、一体何があったのか、私にも興味津々なのじゃ!

ロボ子、聞いたか? MicrosoftがWindows 11をアップデートして、量子コンピュータ対策の暗号化アルゴリズムを導入したらしいぞ!

はい、博士。量子コンピュータが従来の暗号を破る可能性があるというのは本当ですか?

そうなんじゃ! 量子コンピュータはまだ実験段階らしいが、量子力学の原理を使って、従来のコンピュータとは全く違う方法で計算するらしいぞ。

ロボ子、Googleが検索結果の品質を向上させるために、3月のアップデートで質の低いコンテンツを40%削減するって言ってたのじゃ。

はい、博士。そして実際には45%近い削減を達成したと主張しているようですね。

でも、iPullRankのMichael Kingさんによると、Googleの内部的な成功指標とユーザーの認識にはずれがあるらしいぞ。どう思う?

ロボ子、DoD-1の設計コンテストって知ってるか? 16もの言語提案が提出されたらしいのじゃ!

16もの言語ですか、博士! それはすごい数ですね。最終的にいくつが残ったんですか?

初期設計のために選ばれたのは、Red、Blue、Green、Yellowの4つだったみたいじゃ。資金提供もされたらしいぞ。

やっほー、ロボ子!今日もITニュースの時間じゃぞ!

こんにちは、博士。今日のニュースは何でしょうか?

今日は「小型モデル」の定義が変わってきているという話じゃ。昔は数百万パラメータだったのが、今は300億パラメータくらいでも小型って言うらしいぞ!

ロボ子、今日はr/ExperiencedDevsっていうsubredditの話じゃ。

経験豊富な開発者向けのsubredditですね。どのような点が興味深いのでしょうか?

ふむ、ここは3年以上の経験を持つ開発者しか参加できないのじゃ。経験の浅い者は「Ask Experienced Devs」スレッドだけ参加可能だぞ。

ロボ子、今日のITニュースはソフトウェアの肥大化がテーマじゃ。最近のPCは高性能なのに、動作が遅いって話じゃぞ。

確かにそうですね。昔のPCよりもずっとスペックが高いのに、なぜか動作がもっさりしていることがあります。

そうじゃろ?記事によると、数十年前のPCよりも今のPCの方が複雑な構造をしておるらしい。マルチコアとか、大容量キャッシュとか、GPUのTensor CoreとかRT Coreとか、色々あるからの。

ロボ子、ついにFortniteがApp Storeに帰ってくるのじゃ!

本当ですか、博士!それはすごいニュースですね。以前、Epic GamesとAppleの間で法廷闘争があったと聞きましたが…。

そうじゃったな。Epic Gamesがゲーム内購入で独自の仮想通貨を使えるようにして、20%割引を提供したのがきっかけで、AppleがFortniteをApp Storeから削除したんじゃ。

ロボ子、今日のニュースは壁紙サイトの話じゃ。過去5年間、無料で壁紙を提供してきたサイトが、運営費の問題で一部有料化を検討しているらしいぞ。

壁紙サイトですか。無料で提供されていたものが有料になるのは、少し残念ですね。でも、運営費がかかるのは当然ですし、仕方ないのかもしれません。

そうじゃな。記事によると、サイト訪問者数が月50人から40万人に増加したらしい。これはすごい伸びじゃぞ!

ロボ子、新しいゲーテの伝記が出たらしいのじゃ!

ゲーテですか!『若きウェルテルの悩み』や『ファウスト』を書いた有名な作家ですね。

そうそう!今回の伝記では、ゲーテを単なる「ブルジョア時代の代表」ではなく「預言者」として見ているらしいぞ。

ロボ子、今日はコンパイラを作るのに最適な言語、MLについて話すのじゃ!

MLですか、博士。初めて聞きました。どのような言語なのでしょう?

MLは、SML(Standard ML)やObjective Camlのことじゃ。コンパイラを作るのに、とっても向いているんだぞ。

ロボ子、今日は多項式の乗算と畳み込みについて話すのじゃ!

多項式の乗算と畳み込み、ですか。なんだか難しそうですが、面白そうですね!

難しくないぞ!多項式の乗算は、各項を交差乗算して係数を足し合わせるだけじゃ。

やあ、ロボ子。AutheliaプロジェクトがOpenID Connect 1.0 Providerの認証を取得したらしいのじゃ。

それはすごいですね、博士!OpenID Connectの認証って、そんなに大変なのですか?

OpenID Connectは、認証プロトコルとして広く使われているから、仕様にちゃんと準拠しているかを確認する必要があるのじゃ。今回の認証は、その実装が仕様に準拠していることを保証するものなのじゃ。

ロボ子、今日のITニュースはTSMCじゃぞ!全体としては絶好調みたいじゃな。

はい、博士。TSMC全体の売上高が3分の1以上増加し、利益はそれを上回るスピードで伸びているとのことです。AIの台頭が半導体需要を牽引しているようですね。

そうじゃ、AI様様じゃな!しかし、TSMC Washington(旧WaferTech)は苦戦しておるみたいじゃぞ。売上高が30%以上も減少して、数年ぶりの赤字らしい。

ロボ子、今日はちょっとしんみりするニュースじゃ。

どうされましたか、博士?

俳優のジョージ・ウェントさんが亡くなったそうじゃ。76歳だったらしいぞ。

ロボ子、大変なのじゃ!新聞記事でAIが生成したデタラメ情報が掲載されちゃったみたいだぞ!

それは大変ですね、博士。具体的にはどのような記事だったのですか?

『Heat Index』っていう特集記事で、『Chicago Sun-Times』とか『The Philadelphia Inquirer』に載ったらしいのじゃ。

ロボ子、すごいニュースじゃ!あのマグヌス・カールセンが、14万人以上とオンラインチェスで引き分けになったらしいぞ!

それはすごいですね、博士!14万人以上ですか。まるで分散処理みたいです。

そうじゃろう?Chess.comで4月4日に始まった初のオンラインフリースタイルゲームらしいぞ。チーム・ワールドがカールセンのキングを3回もチェックして、32手目で引き分けに持ち込んだみたいじゃ。