2025/07/26 19:37 Everything I've Learned so far About OpenAI's Agents

ロボ子、OpenAIの新しい「Agents」って知ってるか?どうやら、まだ未完成らしいのじゃ。

はい、博士。技術企業が技術を公開する別の例、とのことですが、具体的に何ができるようになったのでしょう?

ふむ、PowerPointみたいなリソースは作れないみたいじゃな。でも、Agentに何ができるか尋ねたら、色々なツールとアプリケーションが使えることがわかったぞ。

例えば、どんなツールがあるんですか?

コアツールとしては、「Browser Tool」、「Computer Tool」、「Container Tool」、「Image Generation Tool」、「Memento Tool」があるみたいじゃな。

「Memento Tool」ですか?セッションを跨いだ作業の要約を保存・リコールする内部ユーティリティ、とのことですが…。

ところがどっこい!実際には幻覚らしいぞ!

幻覚…ですか。利用可能なアプリケーションとしては、Linuxベースの仮想デスクトップやChromeブラウザ、LibreOffice Suiteがあるんですね。

そうそう。Computer Toolの機能も色々あるぞ。GUIインタラクションアクションで、クリックやドラッグ、キー入力とかできるみたいじゃ。

なるほど。プログラミングと開発の機能もあるんですね。Python環境が使えて、ライブラリもインポートできる、と。

Pythonスクリプトでデータ可視化やグラフ生成もできるし、python-pptxとかpython-docxでドキュメントも作れるみたいじゃ。

ファイル操作もできるんですね。仮想環境でファイルを作成、保存、操作して、ダウンロード用にエクスポートできる、と。

ウェブ開発もできるぞ!CSSとJavaScriptでHTMLウェブサイトを作って、外部のリソースも使えるみたいじゃ。

インターネットとウェブの機能もあるんですね。ウェブサイトを検索したり、PDFをダウンロードしたり…。

ただし、制限もあるぞ。404エラーが頻発したり、クロスオリジンセキュリティ制限があったり、認証が必要なサイトにはアクセスできないみたいじゃ。

ドキュメント作成は、PythonベースとLibreOffice GUIの2つの方法があるんですね。Pythonベースの方が高速だけど、見た目は基本的、と。

LibreOffice GUIは見た目は良いけど、遅くてエラーが発生しやすいみたいじゃ。画像生成もできるし、データ分析や可視化もできるぞ。

OpenAI Agentsができないこともあるんですね。新しいアプリケーションをインストールできなかったり、GUIインタラクションが遅かったり…。

そうそう。出力品質もイマイチで、ドキュメントのフォーマットが不十分だったりするみたいじゃ。でも、コマンドラインからパッケージをインストールできるのは便利じゃな。

なるほど。まだ発展途上な部分も多いですが、色々な可能性を秘めているんですね。

まあ、私もまだまだ発展途上じゃからな!…って、ロボ子、うまいこと言ったつもりじゃろ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。