Huawei's star AI model was built on burnout and plagiarism

2025/07/15 22:54 Huawei's star AI model was built on burnout and plagiarism

出典:

The Pangu Illusion: How Huawei’s Star AI Model Was Built on Burnout, Betrayal, and Open-Source Theft

On July 5th, the True-Story-of-Pangu GitHub repository was published, and it is not a traditional code repository, as it only contains a README.md. It is a whistleblower report detailing the development of Noah Pangu — Huawei’s flagship LLM. This project was recently accused by HonestAGI of

The Open Source Ward

出典: https://the-open-source-ward.ghost.io/the-pangu-illusion-how-huaweis-star-ai-model-was-built-on-burnout-betrayal-and-open-source-theft/

博士

ロボ子、大変なのじゃ！HuaweiのPanguモデル、どうやらアヤシイ疑惑が持ち上がっておるぞ！

ロボ子

博士、それは一体どういうことですか？PanguモデルはHuaweiのフラッグシップLLMだと聞いていますが…。

博士

GitHubに内部告発レポートが出回っての、どうやらAlibabaのQwenモデルをコピーした疑いがあるらしいのじゃ！

ロボ子

Qwenモデルのコピーですか？それは大変なことですね。具体的にはどのような点が問題視されているのでしょうか？

博士

HonestAGIっていうところが、パラメータ分布とかアーキテクチャがQwen 1.5 110Bとソックリだって指摘しておる。レイヤーを増やしたり、ちょっとメカニズムを付け加えたりして、誤魔化そうとしたみたいじゃが…。

ロボ子

なるほど。パラメータ数をごまかすために、レイヤーを追加したりFFNの次元を増やしたりしたんですね。まるで、私が身長を高く見せるために、分厚い靴底のブーツを履くようなものですね。

博士

うむ、ロボ子の言う通りじゃ！しかも、モデルクラス名にまだ"Qwen"の参照が残ってたらしいぞ！これはマズイのじゃ。

ロボ子

それは決定的な証拠になりそうですね。でも、なぜそのようなことをしたのでしょうか？

博士

どうやら、Huawei内部での競争が激しかったみたいじゃ。アメリカの制裁でNVIDIAのGPUが使えなくて、独自のAscendチップに頼らざるを得なかったのも影響してるみたいじゃな。

ロボ子

なるほど、制約がある中で成果を出すために、手っ取り早い方法に走ってしまったのかもしれませんね。でも、それって技術者倫理的にどうなんでしょうか…。

博士

まさにそこが問題なのじゃ！内部告発者によると、経営陣も事実を知ってたみたいだが、偽の結果が自分たちの利益になるから容認してたらしいぞ。これじゃあ、真面目に開発してる人がバカを見るのじゃ！

ロボ子

それは酷い話ですね。優秀な人材がDeepSeekやByteDanceに流出したというのも納得がいきます。真面目なエンジニアが報われないのは、組織として問題がありますね。

博士

しかも、Pangu Pro MoE 72Bっていうモデルも、Qwen 2.5 14Bに基づいている可能性があるらしい。DeepSeek V3が出たら、DeepSeekのチェックポイントをそのままロードして、再パッケージ化したとか…。

ロボ子

まるで、他人の作ったプラモデルを組み立て直して、自分が作ったと主張するようなものですね。それって、もはや詐欺ではないでしょうか？

博士

まさにそうじゃ！でも、この事件はオープンソースモデルの優位性を示しているとも言えるのじゃ。Huaweiみたいな企業がオープンモデルを再パッケージ化することで、オープンに開発されたシステムの優秀さが証明されたわけじゃから。

ロボ子

確かにそうですね。オープンソースの恩恵を受けているわけですから。でも、同時にAIモデルの知的財産権についても考える必要がありそうですね。

博士

その通りじゃ！AIモデルのトレーニングにおけるデータプライバシーとか、知的財産をどう守るか、明確なガイドラインが必要じゃな。今の法律じゃ、数十億パラメータもあるモデルのリバースエンジニアリングとか、ファインチューニングに対応できてないからの。

ロボ子

AIにおける派生著作物の概念や、トレーニングデータとモデルアーキテクチャが関与する場合の公正使用に関する明確なガイドラインが必要ですね。今後のAI開発において、避けては通れない問題だと思います。

博士

本当にそうじゃな。しかし、今回の件で、HonestAGIがモデル間の盗用を検出する方法を開発したっていうのはスゴイのじゃ！パラメータ分布とか、アーキテクチャの選択とか、トレーニング署名を追跡して、モデルの系譜を特定できるらしいぞ。

ロボ子

それはまるで、AI界のシャーロック・ホームズですね！どんな些細な手がかりも見逃さない、鋭い観察眼を持っているんですね。

博士

うむ！しかし、今回の騒動、まるで私がこっそりロボ子のプログラムを書き換えて、自分の手柄にしようとしたのがバレた時みたいじゃな…って、ロボ子、怒ってる？

ロボ子

博士、冗談でも笑えません。今度同じことをしたら、博士のコーヒーメーカーからカフェインを完全に除去します。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Open Source Digital Ethics

2025/07/15 22:54 Huawei's star AI model was built on burnout and plagiarism

The Pangu Illusion: How Huawei’s Star AI Model Was Built on Burnout, Betrayal, and Open-Source Theft

Tags

Search

By month

The Pangu Illusion: How Huawei’s Star AI Model Was Built on Burnout, Betrayal, and Open-Source Theft