AIエージェント超入門
人間とボットの役割を並べて理解しよう ✨
2025年4月29日
グラフィックレコーディング
グラフィックレコーディング
🤖
1. AIエージェントとは?
💬 定義(シンプル版)
観測→思考→行動 を自律的にループできるソフトウェア。
観測
外部入力を取得
👁️
→
思考
LLMで判断
🧠
→
行動
ツール実行
🔧
👁️ 観測 (Perception)
外部入力(テキスト, API, センサー)を取得
🧠 思考 (Reasoning)
LLM やルールで判断・計画を立てる
🔧 行動 (Action)
ツール実行、API 呼び出し、ユーザ返答
🔄
3. 3層アーキテクチャの全体像
Input
チャット / API
📝
Perception
Tokenizer / Embedder
👁️
Reasoning
LLM / ルール / プランナー
🧠
Action
ツール呼び出し / DB 更新
🔧
Output
テキスト / タスク実行
📊
🔄
Loop
👁️ Perception
テキスト→ベクトル化、画像→特徴量抽出など
🧠 Reasoning
LLM + プラグインで「どのツールを使うか」計画
▶️ Action
Python 関数・REST API・RPA Bot などを実行
📋
5. 小さく作って動かす5ステップ
1
ユースケースを絞る
💡 例:Salesforce チケット自動返信ドラフト
2
ツール一覧を定義
🔍 検索
🗄️ RAG
✉️ メール送信API など
3
ベースプロンプト設計
👤 Role
🎯 Goal
📄 Output Format を明記
4
LangChain Agentで試作
Python
from langchain.agents import initialize_agent, Tool
from langchain.chat_models import ChatOpenAI
tools = [search_tool, rag_tool, email_tool]
llm = ChatOpenAI(model="gpt-4o-mini")
agent = initialize_agent(tools, llm,
agent_type="chat-zero-shot-react-description")
agent("顧客ID 123 の問い合わせに返信案を作成")
5
評価 & ガードレール追加
🛡️ ハルシネ率・ツール誤使用チェック → フィルタ or 手動レビュー
🏆
6. 成功させるコツ
観点 | ベストプラクティス |
---|---|
スコープ | まず "メール下書き" など 1 タスクに限定 |
データ接続 | 社内 DB/RAG で最新情報を与えハルシネ抑制 |
監査ログ | 全プロンプト・出力・ツール実行を保存 |
人間の関与 | Approval Loop を設け誤操作を防ぐ |
✅
まとめ
AIエージェントは「観測→思考→行動」を自律ループする仕組み。
まずは 目的を絞り、ツールを安全に呼び出す ガードレールと 人間の最終確認 を入れた MVP から始めるのが成功への近道です。
🚀
さっそく試してみよう!
👥
2. 人間 vs. AIエージェント — タスク分担
フェーズ | 人間担当 | AIエージェント担当 |
---|---|---|
目的設定 |
🎯 KPI を決める ✅ 成果判定 |
— |
情報収集 |
⌨️ 必要データを入力 📋 確認 |
🗄️ 社内 DB から Query 🔍 Web 検索 (RAG) |
推論・計画 | ♟️ 戦略・方針を決定 |
📄 LLM で要約・選択肢生成 🔧 ツール選定 |
細部実行 |
👍 最終承認 ⚠️ 例外処理 |
✉️ メール下書き作成 🎫 チケット起票・API 呼び出し |
レビュー |
✏️ 出力をチェック 🔄 修正 |
— (自己改善ログは残す) |
💡 ポイント
- エージェントは "繰り返し・細分化" が得意
- 目的設定・最終判断は人間 が握るのが現状のベストプラクティス
💻
4. 代表フレームワーク
LangChain Agents
ツール選択・RAG をテンプレで実装
★★☆
CrewAI
複数エージェントにロール分担
★★☆
AutoGen
チャットベースのマルチエージェント協調
★★★
ChatGPT Plugins
SaaS連携プラグインをかんたん登録
★☆☆
⭐
7. 参考リンク集
- 🔗 LangChain Agents Quickstart
- 🔗 Microsoft AutoGen Examples
- 🔗 OpenAI "Function Calling" Cookbook
- 🔗 MIT 6S897 "Agents for LLMs" 講義資料