【RPA×生成AI】Uipathで生成AI「Gemini」をAPI呼び出しする方法を徹底解説【ChatGPTやClaudeとの比較もあり】

2025-05-19

RPA×生成AIの可能性

迷える子羊

RPAと生成AIを組み合わせると、どうなるんですか？

現役エンジニア

RPAで自動化できる範囲が広がったり、より複雑な業務に対応できるようになります

例えば・・・

問い合わせ対応の自動化：問い合わせメール内容をAIが自動判定・返信作成し、RPAがメール返信を実行
請求書処理の自動化：請求書の画像をAIで読み取り、RPAがシステムに自動入力
議事録の作成と共有：会議音声からAIで文字起こしし、RPAがデータを共有・記録する

このように生成AI単体でもRPA単体でも実現が難しい自動化も、2つを組み合わせる事で実現できるのです。

この記事では、生成AIとRPAを連携させる最初の1歩として、RPAから生成AIに簡単な命令文（プロンプト）を送信する方法をご紹介します。

RPAで呼び出す生成AIの選定：ChatGPT vs Gemini vs Claude

迷える子羊

生成AIは色んな種類があるけど、どれを使うのが良いの？

現役エンジニア

テストする場合は、無料枠があるGoogleの「Gemini」がおすすめです

主要な生成AI「ChatGPT」「Gemini」「Claude」を比較してみましょう。

価格と性能比較：ChatGPT vs Gemini vs Claude

各生成AIのうち、メジャーなモデルを比較してみます。

ざっくりまとめると

ChatGPT-4o：精度が高く、リアルタイムで翻訳や音声対話が可能だが、ややコストが高い。
Claude 3.5 Haiku：応答速度が非常に早く、安価で文書処理に優れているが、テキストしか扱えない。
Gemini 2.0 Flash：精度はやや劣るが、非常に安価でテキスト・音声・画像・動画を扱える。

スクロールできます

特徴	ChatGPT-4o	Claude 3.5 Haiku	Gemini 2.0 Flash
扱える情報	テキスト、画像、音声	主にテキスト	テキスト、画像、動画、音声
API料金	入力：$2.5 出力：$5.0	入力：$0.8 出力：$4.0	無料枠あり入力：$0.1 出力：$0.7
速度	高速	非常に高速	高速
精度	非常に高い	高い	高い
対応テキスト量	32Kトークン	200Kトークン	1000Kトークン
得意なこと	リアルタイム翻訳、リアルタイム音声対話	高速な情報検索・要約、長文処理	大量のデータ処理・分析、ツール連携

※API料金は100万トークン（日本語で60-70万文字）あたりの価格です

どれも一長一短あるわけですが、今回は無料枠があり性能のバランスの取れたGeminiを使っていきます。

笑顔の子羊

画像や音声データを使った自動化をするなら、ChatGPTかGeminiですね

Gemini 2.0 Flashの無料枠について解説

迷える子羊

Geminiの無料枠って実際どれくらいですか？

現役エンジニア

テストはもちろん、実際の運用でも使い方によっては無料枠に収まる勢いです

Gemini 2.0 Flashの無料枠は以下の通りです。

1 分あたりのリクエスト数：15回
1 日あたりのリクエスト数：1,500回
1 分あたりのトークン数：1,000,000トークン（日本語で60-70万文字程度）

上限を超えた場合、Geminiはエラー（429 RESOURCE_EXHAUSTED）を返します。
つまり勝手に課金されることはありません。

レート制限 | Gemini API | Google AI for Developers

https://ai.google.dev/gemini-api/docs/rate-limits?hl=ja

笑顔の子羊

1日1500回使えて、1分あたり60-70万文字も処理できるのは凄いですね

現役エンジニア

他の生成AIは無料枠すらないので、Googleの本気を感じます

RPAツールは好きなものを使ってください。私は使い慣れたUipathを使っていきます！

生成AIを呼び出す2つの方法：APIキー VS アクセストークン

生成AIをAPI実行する場合、APIキーかアクセストークン（OAuth2.0）を使います。

迷える子羊

ちょっと難しいですね

現役エンジニア

実装が簡単なのはAPIキーですが、セキュリティが強固なのはアクセストークンです

結論：最初は実装が簡単なAPIキーでテストして、本番運用はセキュリティが強固なアクセストークンを使うのが良いでしょう。

APIキーとアクセストークンの違いを簡単に解説します。

APIキーのメリットデメリット

メリット

設定が簡単：GoogleCloudConsoleで簡単に生成でき、実装も比較的容易です。
手軽に試せる：開発初期段階や簡単な用途で手軽にAPIを試すことができます。

デメリット

セキュリティリスクが高い：APIキーは比較的容易に漏洩する可能性があります。漏洩した場合、悪用されるリスクがあります。
監査が難しい：API利用者の追跡が難しく、利用状況の監査が困難になる場合があります。
権限管理の柔軟性が低い：APIキーを特定ユーザーやアカウントに紐付けることが難しいです。

アクセストークン（OAuth2.0）のメリットデメリット

メリット

セキュリティが高い：アクセストークンは有効期限が短く、漏洩リスクを低減できます。
きめ細かい権限管理が可能：権限範囲を指定して、アプリが必要な機能にのみアクセスできるよう制御できます。
監査が容易：特定ユーザーに紐付けてアクセストークンを発行できるため、API利用者の追跡や監査が容易になります。

デメリット

実装が複雑：APIキーに比べて複雑で手間がかかります。
トークンの管理が必要：アクセストークンの取得・保存・有効期限の管理などを行う必要があります。

この記事ではAPIキー/アクセストークン両方の実装方法を解説します。

現役エンジニア

以下の流れで進めていきます

GeminiのAPIキーを取得
GeminiとUipathをAPIキーで連携
アクセストークン/リフレッシュトークンを取得
GeminiとUipathをアクセストークンで連携

STEP①：GeminiのAPIキーを取得する【APIキー】

GoogleAIStudioにサインアップ

GeminiのAPIキーを取得するためには、GoogleAIStudioにアクセスする必要があります。

アクセスできたら「Sign in to Google AI Studio」からサインインしましょう。ご自身のGoogleアカウントでOKです。

GoogleAIStudioでAPIキーを取得する

サインインすると以下の画面が表示されます。画面中央または画面右上の「Get API key」をクリックします。

画面右上の「APIキーを作成」をクリックします。

以下のポップアップが表示されるので、GoogleCloudプロジェクトを選択してください。

まだGoogleCloudプロジェクトが無い場合は、以下の記事を参考にGoogleCloudプロジェクトを作成しましょう。

24Tech – プログラミング、RPA、Wo…

簡単3STEP！アクセストークン/リフレッシュトークンの取得手順【GoogleCloudConsoleでのOAuth2.0認証】 Google Cloud Console OAuth2.0 アクセストークン/リフレッシュトークンを取得する方法を超具体的な3STEPで徹底解説！サルでも分かるように丁寧に教えます。

以下のポップアップが表示されたら、APIキーの作成は完了です。コピーボタンでAPIキーをコピーして控えておきましょう。

現役エンジニア

APIキーが漏洩するとセキュリティリスクがあるので気をつけてください

後からAPIキーを取得する場合は、以下のような表の「APIキー」をクリックすると、もう一度表示することができます。

STEP②：RPA（Uipath）でGeminiを呼び出す【APIキー】

それではRPA(Uipath)で生成AI Geminiを呼び出していきましょう。

前準備：変数を用意する

まず以下の変数を用意してください。変数名はサンプルなので、好きな名前にしてください。

geminiModel（String）：Geminiのモデル名を格納します
apiKey（String）：APIキーを格納します
endPointURL（String）：GeminiのエンドポイントURLを格納します
promptText（String）：AIに渡すプロンプト（命令文）を格納します
jsonPayload（String）：AIに渡す各種設定情報（Json形式）を格納します
jsonObj（JObject）：Geminiの戻り値をJsonオブジェクトに変換する際に使用します

※（）内は変数の型です

完成イメージは以下の通りです。

生成AIに渡すパラメーターを設定する

以下のようにパラメーターを設定しましょう。

geminiModel = "gemini-2.0-flash"
apiKey = "{APIキーを入力}"
endPointURL = "https://generativelanguage.googleapis.com/v1beta/models/" + geminiModel +":generateContent?key=" + apiKey
promptText = "こんにちは、Gemini API！"

完成イメージは以下の通りです。

今回は「Gemini 2.0 Flash」を指定していますが、他のモデルを指定したい場合は「geminiModel」変数の値を変更ください。モデル名は公式ドキュメントを参考にしてください。

生成AIに渡すJSON文字列を作成する

生成AIにAPI経由でプロンプトや各種設定を渡す際は、JSON形式文字列を使用します。

簡単にJSON文字列を扱うには、テキストファイルに記載したJSON文字列を読み込むのが良いです。以下のJSON文字列を適当なテキストファイルに書き込んで保存しましょう。
私は「JsonPayload.txt」というテキストファイルを、プロジェクトフォルダに作成しました。

JsonPayload.txtの内容

{
  "contents": [
    {
      "parts": [
        {
          "text": "{{PROMPT_TEXT}}"
        }
      ]
    }
  ],
  "generationConfig": {
    "responseModalities": [
      "TEXT"
    ],
    "maxOutputTokens": 10000,
    "temperature": 0.2
  }
}

上記Json文字列のパラメーターについて、簡単に解説します。

text

生成AIに対するプロンプト（命令文）を指定します。

responseModalities

AIの応答形式を指定する配列です。TEXTは文字列での回答となります。

maxOutputTokens

生成する応答の最大トークン数を指定します。トークン数を制限することで、API呼び出しのコストを管理できます。

temperature

モデルの出力のランダムさを制御するパラメータです。

0.0 に近いほど、より確定的で予測可能な応答になります。
1.0 に近いほど、よりランダムで創造的な応答になります。

generationConfig以降は省略可能です。

続いて作成したテキストファイルの内容を読み込みます。
「テキストファイルを読み込み」アクティビティを配置し、プロパティを設定します。

ファイル名：作成したテキストファイル名
出力先：最初に作成した「jsonPayload」変数を指定

読み込んだテキストのうち「{{PROMPT_TEXT}}」の部分を「promptText」変数に置換します。

jsonPayload = jsonPayload.Replace("{{PROMPT_TEXT}}",promptText)

Replaceメソッドの詳細は、以下の記事を参考にしてください。

24Tech – プログラミング、RPA、Wo…

【保存版】UiPath文字列操作テクニックを全網羅！CompareTo、IndexOf、PadLeftなど！UiPathやVB.Netで使え… Uipathで使える文字列操作メソッドを全て網羅しました。メソッドの説明から注意点、使用例まで詳しく解説していますので、この記事を見るだけで文字列操作の全てを学べます…

HTTPリクエストを送信して生成AIと会話する

「HTTP要求」アクティビティを配置します。（Uipath.WebAPI.Activitiesパッケージ v25.2.1を使用）

「設定」をクリックして、以下のパラメーターを設定します。設定後はOKボタンで保存します。

エンドポイント：「endPointURL」変数を指定
要求メソッド：POSTを指定

HTTP要求アクティビティを配置し、設定ボタンからエンドポイントと要求メソッドを設定する

次に「HTTP要求」アクティビティのプロパティを設定します。

本文：「jsonPayload」変数を指定（テキストファイルの中身を格納した変数です）
本文形式：「application/json」を指定
応答コンテンツ：「responseContent」変数を指定（戻り値を格納するString型変数）

現役エンジニア

これでGeminiとのAPI連携は完了です！

実行して結果を確認する

「メッセージをログ」アクティビティで「responseContent」変数を出力してみましょう。
以下のようなJSON文字列が表示されたらOKです！

JSON

{
  "candidates": [
    {
      "content": {
        "parts": [
          {
            "text": "こんにちは！Gemini APIをご利用いただきありがとうございます。何かお手伝いできることはありますか？ どんな質問でも、どんなタスクでも、お気軽にお申し付けください。\n"
          }
        ],
        "role": "model"
      },
      "finishReason": "STOP",
      "avgLogprobs": -0.16208763683543487
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 5,
    "candidatesTokenCount": 34,
    "totalTokenCount": 39,
    "promptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 5
      }
    ],
    "candidatesTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 34
      }
    ]
  },
  "modelVersion": "gemini-2.0-flash"
}

主要なパラメーターについて、解説します。

text

生成AI（Gemini）によって生成されたテキスト応答です。

finishReason

モデルが応答の生成を完了した理由を示します。

STOP：モデルが自然に生成を完了した
MAX_TOKENS：トークン上限（maxOutputTokens）に達した
SAFETY：有害なコンテンツの生成を避けるためのフィルタリングによって停止
RECITATION：既存の著作物からの引用や言及が必要である可能性が高い

promptTokenCount

リクエストで送信したプロンプトに含まれるトークンの数です。

candidatesTokenCount

生成された回答（text）に含まれるトークンの合計数です。

totalTokenCount

プロンプトと生成された回答（text）のトークン数の合計です。

modality

プロンプトや回答のデータの種類を示します。ここでは「TEXT」なのでテキストデータです。画像などの他の種類のデータが含まれる場合は、別の要素が追加されます。

tokenCount

modalityのデータのトークン数です。

modelVersion

この回答を生成したGeminiのモデルのバージョンです。

笑顔の子羊

TokenCountで使用したトークン数が分かるので、1分あたりのトークン制限に引っかかるか判断できるのは良いですね

迷える子羊

でもJson文字列からAIの回答だけ取り出すにはどうすれば良いですか？

現役エンジニア

次は回答だけ取り出していきましょう

JSON文字列から生成AIの回答を抽出する

JSON文字列から特定の項目を取り出す場合は、まずJSON文字列をJsonオブジェクトに変換します。

「JSONを逆シリアル化」アクティビティを配置し、JSON文字列プロパティに「responseContent」変数を設定しましょう。

JSONオブジェクトから特定の値（text）を取り出す場合は、以下のように記述しましょう。

jsonObj("candidates")(0)("content")("parts")(0)("text").ToString

上記の実行結果はこちらです。

こんにちは！Gemini APIをご利用いただきありがとうございます。何かお手伝いできることはありますか？ どんな質問でも、どんなタスクでも、お気軽にお申し付けください。

笑顔の子羊

簡単に生成AIとRPAを連携できましたね

APIキーを使った実装はセキュリティリスクがあるので、本番ではアクセストークンを使った実装にしてください。アクセストークンを使った実装方法はこの後解説します。

現役エンジニア

今回作成したプロセスの全体像を共有しておきます

今回作成したAPIキーを使ったプロセスの全体イメージ — APIキーを使った実装

現役エンジニア

続いてアクセストークンを使った実装方法です

STEP③：アクセストークン・リフレッシュトークンを取得

アクセストークンを使ってGeminiAPIと連携する場合、まずはリフレッシュトークンを用意する必要があります。

最終的な完成イメージを先に共有します。

Ueda

フリーランスエンジニア

RPAエンジニアです。
UipathやVBAを使用した開発を得意としています。優れた可読性と効率的な設計を併せ持つRPA開発を心がけています。
RPA初心者向けの教育経験多数あり。RPAの開発サポートも承ります。

Wordpressを用いたHP制作のお仕事も経験があります。本サイトもWordpressを用いて制作しております。

ペットのチワプーと暮らしてます。

お仕事のご依頼はこちらから

URLをコピーしました！

URLをコピーしました！

【RPA×生成AI】Uipathで生成AI「Gemini」をAPI呼び出しする方法を徹底解説【ChatGPTやClaudeとの比較もあり】

RPA×生成AIの可能性

RPAで呼び出す生成AIの選定：ChatGPT vs Gemini vs Claude

価格と性能比較：ChatGPT vs Gemini vs Claude

Gemini 2.0 Flashの無料枠について解説

生成AIを呼び出す2つの方法：APIキー VS アクセストークン

APIキーのメリットデメリット

アクセストークン（OAuth2.0）のメリットデメリット

STEP①：GeminiのAPIキーを取得する【APIキー】

GoogleAIStudioにサインアップ

GoogleAIStudioでAPIキーを取得する

STEP②：RPA（Uipath）でGeminiを呼び出す【APIキー】

前準備：変数を用意する

生成AIに渡すパラメーターを設定する

生成AIに渡すJSON文字列を作成する

HTTPリクエストを送信して生成AIと会話する

実行して結果を確認する

JSON文字列から生成AIの回答を抽出する

STEP③：アクセストークン・リフレッシュトークンを取得

コメント

コメントするコメントをキャンセル

【RPA×生成AI】Uipathで生成AI「Gemini」をAPI呼び出しする方法を徹底解説【ChatGPTやClaudeとの比較もあり】

RPA×生成AIの可能性

RPAで呼び出す生成AIの選定：ChatGPT vs Gemini vs Claude

価格と性能比較：ChatGPT vs Gemini vs Claude

Gemini 2.0 Flashの無料枠について解説

生成AIを呼び出す2つの方法：APIキー VS アクセストークン

APIキーのメリットデメリット

アクセストークン（OAuth2.0）のメリットデメリット

STEP①：GeminiのAPIキーを取得する【APIキー】

GoogleAIStudioにサインアップ

GoogleAIStudioでAPIキーを取得する

STEP②：RPA（Uipath）でGeminiを呼び出す【APIキー】

前準備：変数を用意する

生成AIに渡すパラメーターを設定する

生成AIに渡すJSON文字列を作成する

HTTPリクエストを送信して生成AIと会話する

実行して結果を確認する

JSON文字列から生成AIの回答を抽出する

STEP③：アクセストークン・リフレッシュトークンを取得

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル