2025/06/16 06:14 Open-source 3B param model better than Mistral OCR

ロボ子、今日のITニュースはNanonets-OCR-sじゃ。画像からMarkdownへのOCRモデルらしいぞ。

画像からMarkdownですか。それは便利そうですね。具体的にどのようなことができるんですか?

ふむ、ドキュメントを構造化されたMarkdownに変換できるからの、LLMでの処理がしやすくなるみたいじゃ。
ロボ子、今日のITニュースはNanonets-OCR-sじゃ。画像からMarkdownへのOCRモデルらしいぞ。
画像からMarkdownですか。それは便利そうですね。具体的にどのようなことができるんですか?
ふむ、ドキュメントを構造化されたMarkdownに変換できるからの、LLMでの処理がしやすくなるみたいじゃ。
ロボ子、今日はソースコードを読むことについて話すのじゃ。プログラミングの基本的なスキルとして、これがめっちゃ重要らしいぞ。
ソースコードを読むスキル、ですか。確かに、他の方のプロジェクトを引き継ぐ際に必要になりますね。
そうそう!それに、優れたプロジェクトのコードを読むことは、他者の経験から学ぶための最高の手段の一つなのじゃ!
ロボ子、今日はUSDA(米国農務省)の果物イラストの話じゃぞ!1887年から始まった、リトグラフ複製のためのアーティスト雇用…ロマンがあるのじゃ!
博士、リトグラフですか。農家が視覚的に理解できるようにするため、カラーリトグラフが重要だったんですね。当時の技術で、それはすごいことですね。
そうじゃ!「カラーリトグラフの使用は、農家が特定の出版物で取り上げられた主題と原則を視覚化し理解できるようにするために非常に重要だった」…まるで今のインフォグラフィックみたいじゃな。
やあ、ロボ子。今日のニュースはローズマリーじゃ。ただのハーブだと思うじゃろう?
ローズマリーですか?料理によく使いますね。それが何かITに関係あるんですか?
ふむ、直接ではないのじゃ。しかし、ローズマリーは脳の健康に良い影響を与える可能性があるらしいぞ。記憶力や集中力を高める効果が期待できるらしい。
ロボ子、今日のITニュースは米海軍のスタートアップ連携に関するものじゃ。
米海軍がスタートアップと連携ですか?それは興味深いですね。
そうじゃ。海軍は調達サイクルを短縮して、官僚的な手続きを減らすことで、スタートアップとの連携を容易にしようとしているらしいぞ。
ロボ子、GARMって知ってるか?「暴力的」とか「わいせつ」なコンテンツの定義を明確化しようとしてたらしいのじゃ。
はい、博士。GARMの取り組みについては知っています。広告の安全性に関する議論でよく出てきますね。
そうじゃろ。ところで、世界広告主連盟がXの訴訟の却下を求めてるって話、知ってるか?テキサス州北部地区裁判所が場所としてふさわしくないって。
ロボ子、今日のニュースはウィーンの社会住宅が気候変動対策に役立っているという話じゃ。
社会住宅ですか。日本ではあまり馴染みがないですが、どのようなものなのですか?
ウィーンでは約200万人の住民の約半数が社会住宅に住んでおるらしいぞ。しかも、広めの1LDKで家賃が約700ドルじゃと。
やあ、ロボ子!今日はHarmonyOSのパーミッションについて話すのじゃ。
博士、こんにちは。パーミッション、ですか。なんだか難しそうですね。
難しくないぞ!簡単に言うと、アプリがスマホの機能を使うための許可のことじゃ。例えば、カメラを使うにはユーザーの許可が必要じゃろ?
ロボ子、HP Archiveって知ってるか?ヒューレット・パッカードのビンテージ品を集めたサイトなのじゃ。
HPのビンテージ品ですか!それは面白そうですね。具体的にはどんなものがアーカイブされているんですか?
カタログ、HPジャーナル、価格表、製品マニュアル…昔の技術者たちがどんなことを考えていたのか、タイムスリップできるようなものばかりなのじゃ!
ロボ子、Appleが発表したLRM(大規模推論モデル)に関する論文、読んだかのじゃ?
はい、博士。LRMは正確な計算に限界があり、明示的なアルゴリズムを使用できないと指摘されていましたね。
そうそう。それに対して、Claude Opusを共著者とする反論論文が出たらしいのじゃ。
ロボ子、今日のITニュースは著作権侵害に関する話題じゃぞ。AIモデルがトレーニングデータからテキストを再現できるかどうかって話じゃ。
なるほど、博士。具体的にはどのような内容なのでしょうか?
ニューヨーク・タイムズがOpenAIを訴えた件で、GPT-4が記事の重要な部分を再現した例がいくつかあったらしいのじゃ。OpenAIはそれを「周辺的な行動」って言ってるみたいじゃけど。
ロボ子、今日は政府がAIを推進するニュースがあるのじゃ。トランプ政権が始めたイニシアチブで、連邦政府全体でAIを活用しようとしてるみたいだぞ。
なるほど、それは興味深いですね。具体的にはどのような取り組みなのでしょうか?
米国General Services Administration (GSA) とTechnology Transformation Services (TTS) グループが中心になって、"ai.gov"っていうウェブサイトを開発してるらしいのじゃ。
ロボ子、大変なのじゃ!LOPSAが解散するらしいぞ!
LOPSAですか?それはシステム管理者向けの組織でしたよね。解散とは、一体何があったのでしょう?
そう、LOPSAじゃ。長年の停滞と価値提供の困難さが理由らしいのじゃ。組織を維持するって、本当に大変なのじゃな。
ロボ子、大変なのじゃ!顔認識システムがまたやらかしたみたいだぞ!
博士、どうしたんですか?またですか?
ある女性が、顔認識のエラーでトイレットペーパー泥棒に間違えられたらしいのじゃ。しかも2回も!
やあ、ロボ子。今日はGo言語の並行処理に役立つライブラリ、`cmapv2`について話すのじゃ。
cmapv2、ですか。初めて聞きました。どのようなライブラリなのでしょうか?
`cmapv2`は、並行処理環境で安全に使えるマップ(連想配列)を提供するライブラリなのじゃ。複数のゴルーチンから同時にアクセスしてもデータ競合が起きないように設計されているらしいぞ。
ロボ子、今日のニュースは人間の呼吸パターンで個人を識別できるって話じゃ。
呼吸パターンで個人を識別ですか?それは面白いですね、博士。
そうじゃ。「アルゴリズムを用いて呼吸パターンから個人を97%の精度で識別」できるらしいぞ。すごくない?
ロボ子、今日のニュースは重力についてじゃ。物理学者が重力の新しい解釈を模索しておるらしいぞ。
重力ですか、博士。ニュートンやアインシュタインの研究はよく知られていますが、何か新しい進展があったのでしょうか?
そうじゃ、ロボ子。今、物理学者の間で「エントロピー重力」という考え方が注目されておるのじゃ。重力が、実はもっと微細なスケールでの集団的効果の結果であるというのじゃ。
ロボ子、今日のニュースはちょっと懐かしい感じの話じゃ。
どのような内容でしょうか、博士?
昔のインターネットはもっと自由で、匿名性が高かったらしいのじゃ。今のインターネットは企業に管理されて、監視されてるって嘆いてる人がいるみたいだぞ。
やっほー、ロボ子!今日も面白いAndroidのAPIを見つけてきたのじゃ!
こんにちは、博士。今日はどんなAPIについて教えていただけるんですか?
今日はね、ちょっと変わった名前のAPIたちを集めてみたぞ!例えば、「ActivityManager.isUserAMonkey()」!
ロボ子、UCLAのファウラー美術館が、オーストラリアのラーラキアの人々に文化的に重要な品々を返還したそうじゃぞ。
それは素晴らしいニュースですね、博士。具体的にはどのような品々が返還されたのでしょうか?
10個の緑色のガラスの鏃と、カンガルーの歯のヘッドバンドじゃ。これらは19世紀後半から20世紀初頭に収集されたものらしいぞ。