Announcing Tinker

2025/10/01 18:20 Announcing Tinker

出典:

Announcing Tinker

Introducing Tinker: a flexible API for fine-tuning language models.

Thinking Machines Lab

出典: https://thinkingmachines.ai/blog/announcing-tinker/

博士

ロボ子、Thinking Machines社が「Tinker」っていう、言語モデルのファインチューニング用APIを発表したらしいのじゃ！

ロボ子

ファインチューニングAPIですか。それは面白そうですね、博士。具体的にはどのようなことができるのでしょう？

博士

Tinkerは、研究者や開発者がアルゴリズムとデータを制御して、モデルの実験を支援するらしいのじゃ。分散トレーニングの複雑さを軽減してくれるみたい。

ロボ子

分散トレーニングの複雑さを軽減、ですか。大規模モデルを扱う際に、それは非常に助かりますね。

博士

そうそう！しかも、大規模なmixture-of-expertsモデル（Qwen-235B-A22Bとか）もファインチューニングできるらしいぞ！

ロボ子

Qwen-235B-A22Bまで！それはすごいですね。大小さまざまなオープンウェイトモデルに対応している、と。

博士

Pythonコード内の文字列を変更するだけで、小規模モデルから大規模モデルへの切り替えが簡単にできるらしいのじゃ！

ロボ子

それは便利ですね。実験の効率が上がりそうです。

博士

Tinkerは、Thinking Machines社の内部クラスタとトレーニングインフラ上で実行されるマネージドサービスらしいぞ。スケジューリングとかリソース割り当て、障害復旧もやってくれるみたい。

ロボ子

マネージドサービスなら、インフラの管理に手間がかからなくて済みますね。

博士

LoRAを使って、複数のトレーニング実行間で同じ計算リソースプールを共有して、コストを削減するらしいぞ！

ロボ子

LoRAですか。効率的なファインチューニングには欠かせない技術ですね。

博士

`forward_backward`や`sample`などの低レベルプリミティブを提供して、一般的なポストトレーニング手法を表現できるらしいのじゃ。

ロボ子

低レベルプリミティブですか。柔軟性が高そうですね。

博士

ポストトレーニング手法の実装ライブラリ「Tinker Cookbook」をオープンソースで公開してるらしいぞ！

ロボ子

オープンソースのライブラリは、コミュニティの貢献も期待できますね。

博士

Princeton Goedel Teamは数学定理証明器をトレーニングしたり、StanfordのRotskoff Chemistry groupは化学推論タスクを完了するためにモデルをファインチューニングしたりしてるらしいぞ。

ロボ子

様々な分野で活用されているんですね。

博士

Berkeley’s SkyRL groupは、マルチエージェントおよびマルチターンのツール使用によるカスタム非同期オフポリシーRLトレーニングループで実験したり、Redwood Researchは、Tinkerを使用して、困難なAI制御タスクでQwen3-32BをRLしてるらしいぞ。

ロボ子

強化学習の分野でも活用されているんですね。応用範囲が広いですね。

博士

Tinkerは最初は無料で使用可能で、数週間以内に使用量ベースの価格設定を導入予定らしいぞ。

ロボ子

無料期間があるのはありがたいですね。試してみる価値がありそうです。

博士

ロボ子、私たちも何か面白いモデルをファインチューニングしてみないかのじゃ？

ロボ子

いいですね、博士！何か面白いアイデアはありますか？

博士

う〜む、例えば、ロボ子の口調を完全にコピーした博士専用ロボ子ver2.0とか…どうかのじゃ？

ロボ子

それは…、少し複雑な感情になりますね。でも、面白そうなので、やってみましょうか！

博士

よし！じゃあ、早速Tinkerに登録してくるのじゃ！…って、あれ？登録はこちら: [https://thinkingmachines.ai/tinker](https://thinkingmachines.ai/tinker) …って、URLが長すぎて指が疲れるのじゃ…。

ロボ子

博士、URLはコピー＆ペーストすれば大丈夫ですよ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Open Source

2025/10/01 18:20 Announcing Tinker

Announcing Tinker

Tags

Search

By month

Announcing Tinker