DXを推進するAIポータルメディア「AIsmiley」| AI製品・サービスの比較・検索サイト
03-6452-4750 10:00〜18:00 年末年始除く
よく検索されているキーワード

Gemini(ジェミニ)とは?料金・使い方・活用事例、アプリ最新情報を紹介

最終更新日:2024/04/26

「Gemini(ジェミニ)」は、2023年12月にGoogleから発表された生成AIモデルです。2024年2月には、同社のAIサービスである「Bard」がGeminiへと統合され、最上位バージョンもリリースされるなど急速な進化を遂げており、生成AI業界の新たな進歩を示しています。

本記事では、Geminiの料金や使い方、活用事例など概要について詳しく解説します。2024年2月公開の最新モデルやスマホアプリについてもまとめていますので、自社におけるAIサービスの活用を検討する上でぜひ参考にしてください。

Googleの「Gemini(ジェミニ)」とは

「Gemini(ジェミニ)」は、2023年12月にGoogleが開発した高機能生成AIモデルです。テキストや画像、音声、動画を用いて、チャット形式で簡単に高度なタスクを指示できます。

そもそもマルチモーダルAIとは

Geminiは「マルチモーダルAI モデル」と呼ばれます。マルチモーダルモデルとは、テキストから画像、音声、動画といった、複数の異なるデータを同時に学習、処理できるように統合されたAIモデルのことです。

マルチモーダルAIの例には、大規模言語モデル(LLM)に画像入力を対応させることで進化したOpenAIの「GPT-4」などがあります。種類の異なる情報やデータを行き来し、関係性を作りながら推論する能力を、自然言語処理技術と組み合わせることで、より自然で効率的なタスク処理の実現が期待されています。

Geminiの3つのモデル

Geminiには現在、「Gemini Ultra」「Gemini Pro」「Gemini Nano」という3種類のモデルが存在します。各モデルの主な特徴は、以下の通りです。

  • Gemini Ultra:最も新しい最上位モデルで、高度で複雑なタスクにも対応可能
  • Gemini Pro:幅広いタスクに対応する最良モデル、応答時間の短縮も実現
  • Gemini Nano:スマートフォン(Pixel 8など)上での利用を想定したモデル

Googleは、Geminiを「データセンターからモバイル端末まで柔軟に利用できるモデル」と位置づけており、用途や活用シーンに応じて種類を選ぶことで最適な利用環境を提供します。

GeminiとBardは何が違う?

Googleは、ChatGPTに対抗するように、Gemini以前に「Bard」という名称のAIチャットサービスを提供していました。Geminiのリリース当初は、Bardとは別のサービスとして提供されていましたが、2024年2月のGemini Ultra 1.0の登場と共に、BardそのものがGeminiへと変更されたと発表されています。

現時点ですでに「Google Bard」と検索するとGeminiが表示されます。

Geminiの料金

Geminiの料金は、2024年2月時点で無料です。Googleアカウントを持っている場合は、無料登録することで回数制限なしで自由に使えます。上位バージョンの「Gemini Advanced」にアップデートすると、月額2,900円で無料版よりも便利な機能を利用することが可能です。

また、開発者向けの「Gemini API」を利用してGemini Proを使う場合には、別の料金体系が適用されます。公表されている価格は以下の通りです。

処理方法 金額
テキスト入力 0.00025ドル(約0.035円)/ 1,000文字
画像入力 0.0025ドル(約0.35円)/ 1画像
テキスト出力 0.0005ドル(約0.071円)/ 1,000文字

Geminiが他のAIモデルより優れている点

Googleは、Geminiが「テキスト、画像、音声、動画のベンチマークテストで最高水準を達成した」と公表しています。Geminiと他のAIモデルとの具体的な相違点としては、以下があります。

  • 自然言語処理の能力(複雑な文脈やニュアンスの理解度)
  • 学習と進化の速度
  • 応用可能なジャンルや分野

Geminiでは、マルチモーダルを用いて当初より異なるデータで事前学習させると共に、追加のマルチモーダルデータを使用しファインチューニングを行っています。その結果、あらゆる種類の入力をシームレスに理解し、高度な推論やコード生成にも対応できています。

また、Geminiでは以下のような機能を備えている点も特徴です。

  • Google検索によるWeb上の参照ソースの提示
  • 1度に提示する回答数が3つ
  • 位置情報の反映
  • 出力結果のエクスポート
  • 外部サービスとの連携(Google ドキュメントやGoogle Maps)
  • 外部ファイルの読み込み(Google ドキュメント・スプレッドシート)

Geminiの使い方

Geminiは、Googleアカウントを使って簡単に始めることが可能です。主な手順は、以下の3ステップです。

  1. Google Geminiにアクセスする
  2. 利用規約に同意する
  3. Geminiのチャット画面でプロンプトを入力する

Googleアカウントをまだ持っていない場合には、Googleアカウントを登録した後、Geminiにアクセスしましょう。

まず、Google GeminiのWebサイトを開きます。Googleの検索バーに「Gemini」と入力することでもすぐにページを開けます。「Geminiを試す」というボタンをクリックしましょう。

「利用規約とプライバシー」が表示されたら、下までスクロールします。

右下の「同意する」ボタンをクリックして進みます。

これで、Geminiの登録は完了です。以下の画面が表示されたら、メール配信を希望する場合はチェックを入れて「続ける」を選択しましょう。

チャット画面が表示されたら、プロンプトを入力していきます。

Geminiでできること

Geminiでは、チャット形式で質問やタスク処理を入力することが可能です。具体的なできることとしては、以下が挙げられます。

  • 文章の作成、要約、翻訳
  • 校正、編集
  • 論文や数学など問題の解説
  • 形式に沿ったテキストの作成
  • プログラミングコードの自動生成
  • 画像認識、内容の解説
  • 音声入力
  • 画像生成
  • Googleアプリとの連携

すでにGeminiは日本語に対応していますが、内容によっては英語入力により出力精度が上がる場合があります。

Geminiの活用事例7選

ここからは、Geminiの活用事例を7つ紹介します。企業やビジネスにおいて、どのような用途やシーンでGeminiが使えるのか、具体的な使い方の例を説明しますので、参考にしてください。

スライド資料や画像の内容をテキストにまとめる

Gemini では、画像解析機能を用いて内容の要約やまとめを簡単に作成できます。例えば、スライド資料をアップロードし、プロンプトに「内容を説明してください」と入力するだけで、わかりやすく文章化してもらうことが可能です。

スライドには書かれていないような関連情報も付け足してくれるので、回答だけを読んでも内容を理解できる状態になります。情報量の多い資料や専門領域に特化した資料も、画像解析を活用することで、中身を把握できるでしょう。

また、文字を含まない写真やイラストといった画像の説明を依頼することも可能です。例えば、画像データをアップロードし、プロンプトで「画像について教えて下さい」と質問するだけで、文章で解説してもらえます。

ただ、現時点では人物など対応していない要素やテーマも存在するため注意しましょう。

手書きメモの要約・解説

Geminiは、画像だけでなく手書きのテキストや図も解析できます。この機能を活用することで、画像の内容を詳しく説明したり、要約としてまとめたりといった作業がスピーディに完了します。

例えば、電話を受けた際のメモを要約し、まとめてグループチャットに掲載すれば、情報共有が圧倒的に効率化します。また、出先での走り書きを画像データに起こしてGeminiにアップロードすることで、短時間で簡単にまとめを作成できます。

他にも、手書きアンケートの集計や案内図の清書など、さまざまな用途で活躍が期待できます。

URLからWebページの要約を作成

Geminiでは、WebページのURLから記載されている内容を自動要約することが可能です。ChatGPTなど他のAIサービスでは、URLからWebサイトの名称やページタイトル、内容を読み取ることには対応しておらず、記載内容を自分で調べる必要がありました。

一方、Geminiでは該当ページのURLを貼りつけ、プロンプトとして「このWebページの内容を説明してださい」と入力するだけで回答が得られます。

海外のWebサイトの情報を知りたい場合や、専門的なWebページを解読したいときも、Geminiを利用することで簡単に読み取れるようになるでしょう。情報収集の効率化に役立ちます。

ブログ・メディアの記事や企画の複数提案

Geminiは、1つのプロンプト入力に対して、3つの回答を同時に提案してくれます。ブログやメディアに投稿する記事や企画について、同時に複数のアイデアを返してくれるため、比較検討がより効率的に進みます。

例えば、効率化や時短についてのブログで夕食の献立について記事にまとめたい場合に、食材や調理時間を指定すると3パターンの記事を提案してくれます。

パターン1

パターン2

パターン3

上記の例では献立はもちろん、記事のフォーマットや文章が1つずつ異なるため、もっとも適したものを選ぶことが可能です。

また、キーワードやターゲット層を指定してメディアの企画を考えてもらう、といった使い方もでき、コンテンツ製作の効率化も進むでしょう。

目的や要望に沿ったYouTube動画の検索

Gemini のプロンプト入力だけで、YouTube上の動画を検索することも可能です。例えば、自分が見たい内容のYouTube動画について「〜〜の動画が見たいです」と伝えれば、自動で該当する動画リストを作成してもらえます。

もちろん動画のリンクも付けてくれるので、選択するだけでYouTube動画に移動し、すぐに視聴できます。Geminiから移動することなく動画を探せることにより、作業効率化につながるでしょう。

また、情報収集の一環として使うことも可能です。プロジェクトの関連情報や新しく導入したツールの使い方、基礎知識などを共有したい場合に、チーム内で動画リストを共有しておけば、各自が都合の良い時間に閲覧して準備しておくことが可能です。

録音した商談や会議の音声から議事録を作成

Geminiは音声入力にも対応しており、音声でプロンプトを入力することが可能です。音声で質問を入力するだけで、画面上にテキストで返してくれます。例えば、商談や会議の音声を録音しておいて、Geminiに「音声内容を要約して議事録を作成してください」と入力すれば、瞬時に内容のまとまった資料を出力してくれるでしょう。

インタビューや会議の録音自体はよく使われていますが、音声の文字起こしをした後で資料として清書するのが一般的でした。Geminiを活用することで、文字起こし作業が不要となり、大幅な作業効率化が期待できるでしょう。

アプリケーションの実装コードを複数提案

Geminiは、プログラミングコードの自動生成でも優れた精度を発揮しています。プロンプトでアプリケーションのPython実装コードを依頼すれば、瞬時に自動作成してくれます。

そして、Geminiならではの3種類の提案により、1つのリクエストから複数のコードを生成することも可能です。どのコードを使うか選ぶだけなので、プログラミングの効率化にも大いに役立つでしょう。

また、コードを「Google Colab」などで書き込むこともできるため、自分で細かく調整する必要もなくなります。

GeminiのUltra 1.0とスマホアプリの発表

2024年2月8日に、GoogleはGeminiについてのアップデートを発表しました。ここでは、BardがGeminiへと名称を変更することに加えて、Googleの最新AIモデル「Ultra 1.0」を搭載したGemini Advanced、そしてGemini のモバイルアプリのリリースも伝えられています。

GeminiのUltra 1.0搭載「Gemini Advanced」

新しく発表された Gemini Advanced は、最高クラスの性能を持つAI モデル「Ultra 1.0」を搭載しています。Ultra 1.0搭載のGemini Advancedは、他のAIサービスに比べてコードの自動生成や推論、ニュアンスの理解といった複雑なタスクの処理能力がアップしています。

テクニカルレポートでは、32のAI業界ベンチマークのうち、30の項目で既存の最高水準を上回っていると公表されています。加えて、数学や機械翻訳などにおいてもテキストベンチマークの最高スコアを記録するなど、大幅な性能の向上が実現しています。

Gemini Advanced は、Google One AI Premiumプラン(月額2,900円)で利用可能で、無料トライアルも用意されています。日本でもスタートしていますが、現在は英語版のみで、対応言語は順次拡大予定です。

Gemini のスマホ向けアプリ

Geminiのスマホ向けアプリもリリースされています。ただ、Android スマートフォンではGemini アプリをインストール可能ですが、iOSではGoogle アプリでGemini・Gemini Advanced (英語版のみ)を使用できます。

スマホからGemini が使えるようになれば、音声入力や画像解析といった機能をより簡単に、さまざまなシーンで活用することが可能です。例えば、外出先で道に迷ってしまった際に、周囲の写真を使って道案内を依頼する、といった方法です。他にも、海外での画像の質問、言語翻訳など多くの用途に使えます。

Geminiまとめ

Geminiは、Googleが誇る革新的な最新AIモデルです。高性能なマルチモーダルモデルを搭載し、さまざまなベンチマークでも最高水準の結果を出しており、テキストから音声、動画、画像まで幅広いデータを用いたタスク処理を実現しています。

他のAIサービス同様、Geminiも進化の途中であり、最近では最上位モデルのアップデートとスマホアプリがリリースされたばかりです。今回紹介したGemini活用事例も参考にして、自社における生成AIサービスの活用についてぜひご検討ください。

生成AIサービスの資料請求

よくある質問

GeminiとChatGPT Plusの違いは?

ChatGPT Plusは、OpenAIの代名詞でもあるLLMを搭載したAIチャットサービスの有料プランで、最新「GPT-4」が利用できる点が特徴です。
Google のGeminiとOpenAIのChatGPT Plusではまず、利用料金が異なります。
Geminiは無料、Gemini Advancedは月額2,900円ですが、ChatGPT Plusは月額20ドル(約3,000円)です。
また、学習データについて、Geminiでは非公開ですが、ChatGPT Plusは2023年4月までと公開されています。
さらに、音声入力がアプリ以外でも利用できるのはGeminiだけです。

Gemini Nanoは手持ちのスマホで使える?

Gemini Nanoは、スマホでも利用可能です。
GeminiアプリはAndroid向けのみですが、iOSではGoogleアプリ上でGeminiを利用できます。
なお、Google社のスマートフォン「Pixel 8 Pro」には、Geminiが搭載されており、初のAI 内蔵スマートフォンとして話題を集めています。

Geminiは日本語対応している?

Geminiは日本語に対応しており、プロンプトの入力や出力も日本語で行うことが可能です。
2024年2月のアップデートで、GoogleのBardに導入されていた「Gemini Pro」が、日本語など英語以外の40以上の言語に対応したと発表されています。

AIsmiley編集部

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています
@AIsmiley.inc
・Xもフォローください
@AIsmiley_inc

DXトレンドマガジン メールマガジン登録

業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓

姓を入力してください

お名前 - 名

名を入力してください

メールアドレス

メールアドレスを入力してください

AI・人工知能記事カテゴリ一覧

今注目のカテゴリー

ChatGPT連携サービス

チャットボット

画像認識・画像解析

需要予測

ChatGPT連携サービス

チャットボット

画像認識・画像解析

需要予測

AI活用のご相談したい企業様はこちら

03-6452-4750

AI製品・ソリューションの掲載を
希望される企業様はこちら