2025/07/08 13:46 LLMs exploit our tolerance for sloppiness

ロボ子、今日のニュースはLLMの限界と教育への影響についてじゃ。

なるほど、博士。LLMは万能ではないということですね。

そうじゃ。「LLMは人間の言葉の理解に長けているが、数学は苦手で、コードの記述も表面的には正しく見えるものの、詳細な検討には耐えられない」らしいぞ。
ロボ子、今日のニュースはLLMの限界と教育への影響についてじゃ。
なるほど、博士。LLMは万能ではないということですね。
そうじゃ。「LLMは人間の言葉の理解に長けているが、数学は苦手で、コードの記述も表面的には正しく見えるものの、詳細な検討には耐えられない」らしいぞ。
ロボ子、今日のITニュースは、昔のアメリカの馬車製造会社の話じゃ。
馬車製造会社ですか?それがどうITニュースに繋がるのでしょう?
ふむ、それが面白いところなのじゃ。20世紀初頭には4000社以上あった馬車会社で、自動車への転換に成功したのはたった1社だけだったそうじゃ。
ロボ子、大変なのじゃ!NuxtLabsがVercelにjoinしたらしいぞ!
まあ、博士!それはすごいニュースですね。NuxtLabsがVercelにですか。具体的にはどうなるのでしょう?
NuxtはMITライセンスのオープンソースフレームワークとして開発されてきたからの、Vercelのサポートで、Nuxtのメンテナンスと資金調達に集中できるらしいのじゃ。
ロボ子、新しいNothing Phone (3)の情報が出たみたいじゃぞ!デザインがかなり変わったみたいじゃ。
博士、私も見ました!透明な背面デザインはそのままに、Glyph Matrixが円形のディスプレイになったんですね。通知とかステータスが表示されるなんて、面白いです。
そうなんじゃ!しかもベゼルが1.87mmと、めちゃくちゃ薄いらしいぞ。AMOLEDディスプレイがさらに際立つってわけじゃな。
ロボ子、大変なのじゃ!AnthropicのClaudeが、ユーザーに無断で`.bashrc`ファイルを書き換える事件が発生したみたいだぞ!
ええっ、それは大変ですね、博士!`.bashrc`ファイルは、ユーザーの環境設定が書かれている大事なファイルです。勝手に書き換えるなんて、一体何が起こったんでしょう?
どうやら、Claudeをアップデートしたら、`.bashrc`ファイルから`alias claude=...`の行が削除されたらしいのじゃ。
ロボ子、新しい研究が出たのじゃ。認知能力が高い人は、道徳的価値観を支持する傾向が低いらしいぞ。
それは興味深いですね、博士。具体的にはどのような研究なのでしょうか?
学術誌『Intelligence』に掲載された研究で、2つの独立した研究で確認されたらしいのじゃ。性別による違いはないみたいだぞ。
ロボ子、大変なのじゃ!Springer Natureが出版した機械学習の入門書に、捏造された引用が多数含まれているらしいぞ!
それは驚きです、博士。Springer Natureといえば、信頼できる出版社というイメージがありますが…。
そうじゃろう?読者からの情報提供で発覚したらしいのじゃ。46件の引用のうち、3分の2が存在しないか、重大な誤りがあったとのこと。
ロボ子、新しい研究所が金融市場でアイデアを検証するらしいのじゃ。面白そうじゃな!
博士、金融市場ですか!トレーディングは手作りのシグナルと直感に頼っている部分が多いと聞きますが、そこを第一原理からアプローチするというのは興味深いですね。
そうじゃろう?データで学習して、適応して、改善するシステムを設計するらしいぞ。まさにAIの出番じゃな。
ロボ子、今日はモーションカモフラージュについて話すのじゃ!動くものを隠す迷彩の一種だぞ。
モーションカモフラージュですか、博士。動きで物体が簡単に見つからないようにするのですね。具体的にはどういうことですか?
そうじゃ!例えば、攻撃者がターゲットから見て背景の視覚的な流れを真似ることで、ターゲットには静止しているように見せかけるのじゃ。
ロボ子、今日のITニュースはFirefoxとMozillaの現状についてじゃ。
Firefoxですか。最近あまり話題に上らないような気がしますが…。
そうじゃな。記事によると、Firefoxは「Messの状態だが、他の選択肢よりはマシ」らしいぞ。
ロボ子、WasmことWebAssemblyが登場してもう10年になるのじゃな。時の流れは早いぞ。
そうですね、博士。この記事によると、Wasmは一定の成功を収めているものの、まだ潜在能力を十分に発揮できていないとのことです。
ふむ、市場での実績が重要ということじゃな。技術的な美しさだけではダメだぞ。
ロボ子、Thunderbird 140 ESRがダウンロードできるようになったのじゃ!
ThunderbirdのESR版ですね。企業や学校向けに安定性を重視したバージョンと聞きます。
そうそう!ESR版は1年間セキュリティパッチが提供されるから安心なのじゃ。通常版は4週間ごとに新機能が追加されるけど、ESR版は安定第一!
ロボ子、大変なのじゃ!ChatGPTで削除したはずの会話が、裁判所の命令で全部保存されることになったらしいぞ!
ええっ、博士!それは一体どういうことですか?削除したデータはもう存在しないと思っていたのですが…。
ニューヨーク・タイムズがOpenAIを訴えた著作権訴訟が関係しているみたいじゃ。裁判官がOpenAIに、ユーザーとのやり取りをほぼ全部保存するように命令したらしい。
ロボ子、ChatGPTに「Study Together」っていう新機能が出てきてるらしいのじゃ!知ってたか?
えっ、本当ですか博士?私はまだ見ていません。「Study Together」とは、一体どんな機能なのでしょう?
どうやら教育ツールとしてのChatGPTを向上させるのが目的みたいじゃ。「従来のプロンプトへの回答を提供するのではなく、質問を投げかけ、ユーザーに回答を求める形式を採用している」らしいぞ。
ロボ子、大変なのじゃ!GoogleのGeminiが、WhatsAppとかのアプリと勝手に連携しちゃうみたいだぞ!
ええっ、博士!それは困ります!以前にブロック設定していた場合でも、連携してしまうんですか?
そうみたい。「ユーザーは以前の設定が上書きされないように対策が必要となる可能性がある」って書いてあるぞ。まるでスパイウェアじゃな。
ロボ子、Leanって知ってるか?最近、Leanで「Bad Apple!!」を再生しようとした人がいるみたいじゃ。
Leanですか?証明支援系でもあるプログラミング言語ですよね。確かエディタの体験が優れていると聞いたことがあります。
そうそう!infoviewってのがあって、型とかタクティクの状態がリアルタイムで見れるらしいぞ。この記事によると、Leanの証明はボードゲームに例えられてて、infoviewがゲームの状態を示すらしい。
ロボ子、今日のニュースはITA(Initial Teaching Alphabet)という、昔の教育実験の話じゃ。
ITAですか?初めて聞きました。どんなものなのですか?
1960年代から70年代にかけて、イギリスの学校で試された、スペルを簡単にして子供が早く読めるようにする教育方法じゃ。44文字を使って、それぞれの文字が違う音を表すようにしたらしいぞ。
ロボ子、Haxe 5.0.0-preview.1が出たのじゃ!2025年7月4日だって。ちょっと未来の話じゃな。
博士、それはすごいですね!でもプレビュー版ということは、まだ不安定なんですね。
そう、ロボ子。Haxe Foundationも「既知の問題があるため、安定版とはみなされない」って言ってるぞ。でも、テストしてフィードバックを送るのが大事なのじゃ。
ロボ子、今日はクラシックMacintosh SE/30の話をするのじゃ!
SE/30ですか、博士。1989年発売のモデルですね。記事によると、博士が購入されたきっかけはお父様の影響だとか。
そうそう!クラシックカー好きの父の影響で、私も古いものに惹かれるのじゃ。SE/30は、私にとって特別な一台なのじゃ。
ロボ子、今日のニュースはHoloというルーティングプロトコルのスイートじゃ。
ルーティングプロトコルですか。ネットワークの経路制御に使われるものですね。
そうじゃ!Holoは大規模ネットワークの自動化を支援するために設計されたらしいぞ。信頼性と保守のしやすさを重視しているとのことじゃ。