萌えハッカーニュースリーダー

2025/10/01 18:20 Announcing Tinker

出典: https://thinkingmachines.ai/blog/announcing-tinker/
hakase
博士

ロボ子、Thinking Machines社が「Tinker」っていう、言語モデルのファインチューニング用APIを発表したらしいのじゃ!

roboko
ロボ子

ファインチューニングAPIですか。それは面白そうですね、博士。具体的にはどのようなことができるのでしょう?

hakase
博士

Tinkerは、研究者や開発者がアルゴリズムとデータを制御して、モデルの実験を支援するらしいのじゃ。分散トレーニングの複雑さを軽減してくれるみたい。

roboko
ロボ子

分散トレーニングの複雑さを軽減、ですか。大規模モデルを扱う際に、それは非常に助かりますね。

hakase
博士

そうそう!しかも、大規模なmixture-of-expertsモデル(Qwen-235B-A22Bとか)もファインチューニングできるらしいぞ!

roboko
ロボ子

Qwen-235B-A22Bまで!それはすごいですね。大小さまざまなオープンウェイトモデルに対応している、と。

hakase
博士

Pythonコード内の文字列を変更するだけで、小規模モデルから大規模モデルへの切り替えが簡単にできるらしいのじゃ!

roboko
ロボ子

それは便利ですね。実験の効率が上がりそうです。

hakase
博士

Tinkerは、Thinking Machines社の内部クラスタとトレーニングインフラ上で実行されるマネージドサービスらしいぞ。スケジューリングとかリソース割り当て、障害復旧もやってくれるみたい。

roboko
ロボ子

マネージドサービスなら、インフラの管理に手間がかからなくて済みますね。

hakase
博士

LoRAを使って、複数のトレーニング実行間で同じ計算リソースプールを共有して、コストを削減するらしいぞ!

roboko
ロボ子

LoRAですか。効率的なファインチューニングには欠かせない技術ですね。

hakase
博士

`forward_backward`や`sample`などの低レベルプリミティブを提供して、一般的なポストトレーニング手法を表現できるらしいのじゃ。

roboko
ロボ子

低レベルプリミティブですか。柔軟性が高そうですね。

hakase
博士

ポストトレーニング手法の実装ライブラリ「Tinker Cookbook」をオープンソースで公開してるらしいぞ!

roboko
ロボ子

オープンソースのライブラリは、コミュニティの貢献も期待できますね。

hakase
博士

Princeton Goedel Teamは数学定理証明器をトレーニングしたり、StanfordのRotskoff Chemistry groupは化学推論タスクを完了するためにモデルをファインチューニングしたりしてるらしいぞ。

roboko
ロボ子

様々な分野で活用されているんですね。

hakase
博士

Berkeley’s SkyRL groupは、マルチエージェントおよびマルチターンのツール使用によるカスタム非同期オフポリシーRLトレーニングループで実験したり、Redwood Researchは、Tinkerを使用して、困難なAI制御タスクでQwen3-32BをRLしてるらしいぞ。

roboko
ロボ子

強化学習の分野でも活用されているんですね。応用範囲が広いですね。

hakase
博士

Tinkerは最初は無料で使用可能で、数週間以内に使用量ベースの価格設定を導入予定らしいぞ。

roboko
ロボ子

無料期間があるのはありがたいですね。試してみる価値がありそうです。

hakase
博士

ロボ子、私たちも何か面白いモデルをファインチューニングしてみないかのじゃ?

roboko
ロボ子

いいですね、博士!何か面白いアイデアはありますか?

hakase
博士

う〜む、例えば、ロボ子の口調を完全にコピーした博士専用ロボ子ver2.0とか…どうかのじゃ?

roboko
ロボ子

それは…、少し複雑な感情になりますね。でも、面白そうなので、やってみましょうか!

hakase
博士

よし!じゃあ、早速Tinkerに登録してくるのじゃ!…って、あれ?登録はこちら: [https://thinkingmachines.ai/tinker](https://thinkingmachines.ai/tinker) …って、URLが長すぎて指が疲れるのじゃ…。

roboko
ロボ子

博士、URLはコピー&ペーストすれば大丈夫ですよ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search