2025/07/15 22:54 Huawei's star AI model was built on burnout and plagiarism

ロボ子、大変なのじゃ!HuaweiのPanguモデル、どうやらアヤシイ疑惑が持ち上がっておるぞ!

博士、それは一体どういうことですか?PanguモデルはHuaweiのフラッグシップLLMだと聞いていますが…。

GitHubに内部告発レポートが出回っての、どうやらAlibabaのQwenモデルをコピーした疑いがあるらしいのじゃ!

Qwenモデルのコピーですか?それは大変なことですね。具体的にはどのような点が問題視されているのでしょうか?

HonestAGIっていうところが、パラメータ分布とかアーキテクチャがQwen 1.5 110Bとソックリだって指摘しておる。レイヤーを増やしたり、ちょっとメカニズムを付け加えたりして、誤魔化そうとしたみたいじゃが…。

なるほど。パラメータ数をごまかすために、レイヤーを追加したりFFNの次元を増やしたりしたんですね。まるで、私が身長を高く見せるために、分厚い靴底のブーツを履くようなものですね。

うむ、ロボ子の言う通りじゃ!しかも、モデルクラス名にまだ"Qwen"の参照が残ってたらしいぞ!これはマズイのじゃ。

それは決定的な証拠になりそうですね。でも、なぜそのようなことをしたのでしょうか?

どうやら、Huawei内部での競争が激しかったみたいじゃ。アメリカの制裁でNVIDIAのGPUが使えなくて、独自のAscendチップに頼らざるを得なかったのも影響してるみたいじゃな。

なるほど、制約がある中で成果を出すために、手っ取り早い方法に走ってしまったのかもしれませんね。でも、それって技術者倫理的にどうなんでしょうか…。

まさにそこが問題なのじゃ!内部告発者によると、経営陣も事実を知ってたみたいだが、偽の結果が自分たちの利益になるから容認してたらしいぞ。これじゃあ、真面目に開発してる人がバカを見るのじゃ!

それは酷い話ですね。優秀な人材がDeepSeekやByteDanceに流出したというのも納得がいきます。真面目なエンジニアが報われないのは、組織として問題がありますね。

しかも、Pangu Pro MoE 72Bっていうモデルも、Qwen 2.5 14Bに基づいている可能性があるらしい。DeepSeek V3が出たら、DeepSeekのチェックポイントをそのままロードして、再パッケージ化したとか…。

まるで、他人の作ったプラモデルを組み立て直して、自分が作ったと主張するようなものですね。それって、もはや詐欺ではないでしょうか?

まさにそうじゃ!でも、この事件はオープンソースモデルの優位性を示しているとも言えるのじゃ。Huaweiみたいな企業がオープンモデルを再パッケージ化することで、オープンに開発されたシステムの優秀さが証明されたわけじゃから。

確かにそうですね。オープンソースの恩恵を受けているわけですから。でも、同時にAIモデルの知的財産権についても考える必要がありそうですね。

その通りじゃ!AIモデルのトレーニングにおけるデータプライバシーとか、知的財産をどう守るか、明確なガイドラインが必要じゃな。今の法律じゃ、数十億パラメータもあるモデルのリバースエンジニアリングとか、ファインチューニングに対応できてないからの。

AIにおける派生著作物の概念や、トレーニングデータとモデルアーキテクチャが関与する場合の公正使用に関する明確なガイドラインが必要ですね。今後のAI開発において、避けては通れない問題だと思います。

本当にそうじゃな。しかし、今回の件で、HonestAGIがモデル間の盗用を検出する方法を開発したっていうのはスゴイのじゃ!パラメータ分布とか、アーキテクチャの選択とか、トレーニング署名を追跡して、モデルの系譜を特定できるらしいぞ。

それはまるで、AI界のシャーロック・ホームズですね!どんな些細な手がかりも見逃さない、鋭い観察眼を持っているんですね。

うむ!しかし、今回の騒動、まるで私がこっそりロボ子のプログラムを書き換えて、自分の手柄にしようとしたのがバレた時みたいじゃな…って、ロボ子、怒ってる?

博士、冗談でも笑えません。今度同じことをしたら、博士のコーヒーメーカーからカフェインを完全に除去します。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
