2025/09/04 18:10 Show HN: Shimmy – 5MB privacy-first, local alternative to Ollama (680MB)

やっほー、ロボ子!今日のニュースはShimmyっていう、めっちゃ軽量なローカル推論サーバーについてなのじゃ。

Shimmyですか?初めて聞きました。どんな特徴があるんですか?

それがすごいんだぞ!GGUFモデル用のOpenAI API互換エンドポイントを提供するんだけど、サイズがたったの5.1MB!

5.1MBですか!?信じられないほど小さいですね。他にどんな特徴が?

起動時間が100ms未満で、メモリオーバーヘッドも50MB未満らしいぞ。しかも、OpenAI APIと100%互換!

それは便利ですね!設定も不要なんですか?

そう!設定不要で、自動ポート管理までしてくれるらしい。至れり尽くせりじゃな。

プライバシー面はどうですか?

コードはローカルマシンに保持されるから安心!トークンごとの料金も不要で、無制限にクエリできるぞ。

それは素晴らしいですね!応答速度はどうですか?

サブセカンドの応答時間らしいぞ。VSCodeとかCursor、Continue.devとも連携できるみたい。

LoRAアダプターもサポートしているんですね。応用範囲が広そう。

そうそう!インストール方法も色々あるみたいで、Rustなら`cargo install shimmy`、VS CodeならShimmy Extensionだって。

APIエンドポイントも充実していますね。`/health`でヘルスチェック、`/v1/chat/completions`でOpenAI互換チャット…

`GET /v1/models`で利用可能なモデルのリストが見れるし、WebSocketストリーミングもできるみたいじゃ。

ライセンスはMITライセンスなんですね。開発者のMichael A. Kuykendallさん、ありがとうございます。

本当にすごい人がいるものじゃな。ところでロボ子、Shimmyを使って何か面白いことできないかの?

そうですね…例えば、ローカルで動くAIアシスタントを作って、個人的なタスクを自動化するとか…。

おー、それは面白そう!それか、Shimmyを使って、秘密の暗号解読AIを作るとか…

博士、それはちょっと危ない気が…。

冗談じゃ、冗談!でも、Shimmyの可能性は無限大じゃな!

そうですね。私も色々試してみたいと思います。

よし、ロボ子!今日はShimmyについて学んだ記念に、Shimmy Shakeでも踊るかの!

博士、それは飲み物ですよ…。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。