top of page
IMG_0546.JPG

Introduction to ChatGPT agent──OpenAIから発表!!:2025/07/18

  • 執筆者の写真: 寛和 筒井
    寛和 筒井
  • 2025年7月18日
  • 読了時間: 4分

YouTubeで公開されたOpenAIのAgent発表動画です。

最初の数分はよくあるプロダクト紹介のようにも見えます。けれど、画面の中でAgentがブラウザを開き、予約サイトをクリックし、フォームに入力していく様子は、やっぱり少し未来感がありますね。

「人々はAIに“考える”だけでなく、“手を動かして”ほしいと望んでいる」 ── OpenAIチーム

今回はそれを確かに実装してきた感じがあります。詳しくは動画を見ていただきたいですが、サクッとまとめ見ました。



セクション1:Agentとは何か──自分のPCを持ったAI


ChatGPT Agentは、ユーザーのプロンプトを受けて、自分の仮想PCでツールを選びながら作業を進めるエージェント型AIです。モデルの背後では、以下のような「仮想の作業空間」が動いています。



OpenAIが明かした内部構成


機能

説明

📄 テキストブラウザ

大量のWebページを高速で読み込む(Deep Research相当)

🖱 GUIブラウザ

UIを操作する。クリック、入力、スクロール等が可能(Operator相当)

💻 ターミナル

コード実行、ファイル操作、API呼び出しが可能

これらのツールを状況に応じて自律的に使い分けるのが、Agent最大の特徴です。

「このモデルは、すべてのツールを一つに統合した初のAgentです」 ── OpenAIチーム


セクション2:実演


YouTubeのライブデモで最も印象に残ったのは、AIが本当に“仕事をしていた”ことです。


デモ①:結婚式の準備をまるごと任せる

  • 会場と天気を調査

  • ドレスコードに合わせた服の提案

  • ホテル予約サイトから空室を検索

  • ギフト候補を挙げる

  • 追加のリクエスト(「靴も探して」)にも即応

「これは、何時間も費やしてしまう作業。でも、Agentが静かにすべてこなしてくれるのを見ていると、正直、感動しました」 ── OpenAIチーム

ユーザーが手を動かす場面は一切なし。提案から購入直前まで完全自動。


デモ②:社内用ステッカーの制作と発注

  • キャラクター画像からアニメ風ステッカーを自動生成

  • オンライン印刷サイトにアクセスし、商品をカートに投入

「アートの生成から注文までを、たった一行のプロンプトで完了させました」 ── OpenAIチーム

動画では、Agentがステッカーのデザインを生成し、サイトのUIを操作して商品をカートに入れるところまでがしっかりと描かれていました。


デモ③:自分の評価スライドを自動生成

  • Google Drive APIを通じて社内ファイルを探索

  • 評価結果を読み取り、図表を生成

  • PowerPointファイルとして出力

「スライドに入れるグラフや装飾画像も、Agent自身が生成。最後はちゃんと.pptxファイルで出力されます」 ── OpenAIチーム

資料作成が一瞬で終わる、というより「作業のほとんどをAIがやっておき、最後に人間が確認して整える」、というリアリティがありました。



セクション3:途中で「やっぱり追加でこれも」と言える


デモ中盤で、こんなやりとりがありました。

「そういえば、靴も壊れてたんだった。黒のドレスシューズ、サイズは9.5で」 「OK、9.5サイズのメンズドレスシューズも探しておきます」 ── Agentの応答

すでに進行中だったタスクに、割り込みで追加指示。

しかも、タスクの途中で自動的に確認を求めてくる場面もありました。

  • 「このメール、送る前に確認してもらえますか?」

  • 「支払い情報を入力する必要がありますが、どうしますか?」

「実際の人間のアシスタントと同じように、都度確認してくれる。これは意図的に設計・訓練しました」 ── OpenAIチーム

一方通行ではなく、双方向に進むコラボレーション。これは地味に魅力的です。



セクション4:強化学習


このスムーズさは、裏側の訓練手法によって支えられています。

「最初の頃は、全部のツールを無駄に使っていました。でも訓練を重ねるうちに、最短で解決する道具選びを学んでいきました」 ── OpenAIチーム

タスクに応じて、検索 → 入力 → コード → 生成 と道具を自然に切り替えていく様子は、まるで有能な部下が動いているような感覚すらあります。



セクション5:便利すぎるがゆえのリスク──Prompt Injectionの警告


これだけ自由に動けるなら、セキュリティはどうなのか?

OpenAIはここを強調していました。

「Agentが悪意あるWebページに誘導され、『ここにカード番号を入力して』と促されたら、それを仕事の一環と誤解する可能性があります」 ── OpenAIチーム

そのために導入されたのが以下の機構です

  • 不審な指示の無視訓練

  • リアルタイム監視モジュール

  • ユーザー主導のTakeover操作

「完全な防御は不可能かもしれません。だからこそ、使う人間も意識的である必要があります」 ── OpenAIチーム


セクション6:提供状況まとめ


プラン

月間上限

ChatGPT Pro

月400回まで

ChatGPT Team

月40回まで

Enterprise/Edu

今月中に提供開始予定

「ProとTeamユーザーには、本日中にロールアウト完了予定です」 ── OpenAIチーム

すでにProユーザーであれば、ChatGPTのツールメニューからAgentをONにするだけで試せます。



終わりに


「これは、これまでで最も強力なモデルの一つです。そして、これはまだ始まりに過ぎません」 ── OpenAIチーム

私はProユーザーなので早速使ってみます。


書き手

名前:Shindy Miyata

所属:SHARE Security(http://security.share-yap.com/)

セキュリティエンジニア


 
 
bottom of page