OpenAI(オープンAI)とは?各AIツールの使い方や日本との関係性、最新動向を解説
最終更新日:2024/05/16
OpenAI社は、2015年にサム・アルトマンやイーロン・マスクなど、複数のグローバルリーダーによって設立された非営利研究機関です。人類にとって有益なAI発展を目的とし、さまざまなAIモデルやサービスを開発しています。
OpenAI社を代表するAIサービス「ChatGPT」は、2022年末から1年弱の間に急速な進化を遂げ、大規模自然言語モデル(LLM)による対話型AIサービスの代名詞的存在になりました。2023年11月17日には、CEOであるサム・アルトマン氏の解任や社長の辞任により、混乱の渦中であることが報道され、OpenAI社の動向に対する注目度もより高まっています。
本記事では、OpenAIや各AIツールの使い方、AIの発展に関する日本との関係性などについて解説します。OpenAIが手がけるAI開発について知りたい方や、これからAIサービスを利用してみたいとお考えの方は、ぜひ参考にしてください。
生成AIについて詳しく知りたい方はこちらの記事もご覧ください。
生成AI(ジェネレーティブAI)とは?種類・使い方・できることをわかりやすく解説
OpenAI(オープンAI)とは?
OpenAIとは、アメリカのサンフランシスコに拠点を置く、人工知能(AI)の開発および普及を目的とした非営利研究機関のことです。近年、OpenAIが開発したテキスト生成系AIの「ChatGPT」が話題になっていることもあり、名前を耳にしたことがある方もいるかもしれません。
OpenAIでは「人類に有益な形でAIを発展させること」を目指しており、テスラ社CEOのイーロン・マスクや、OpenAIの現CEOであるサム・アルトマンなど、多様なグローバルリーダー達によって2015年に組織されました。
人類に役立つ形でAIを発展させるために、ロボット工学や機械学習、経済学など多様な分野で研究を行っており、世界を変革させる可能性を秘めた最先端のAIモデルやAIツールをいくつか公開しています。
OpenAIが開発したAIモデルの中では、学習したデータから新しいデータを生み出す「ジェネレーティブAI」が特に注目されています。ジェネレーティブAIを活用することで、新たな画像やテキスト、音声などを瞬時に生成できます。
OpenAIの歴史
2015年に設立された後、同社が最初に開発したのは、2016年4月に公開された強化学習の開発用ツールキット「OpenAI Gym」のベータ版でした。その後、2016年11月にはマイクロソフトとの提携を締結しており、同社のクラウドサービスである「Azure」には、OpenAIの学習モデルが活用されています。
2016年12月に公開したAI学習プラットフォームの「Universe」を最後に、強化学習関連のプラットフォームやモデル開発は一旦落ち着きを見せ、2018年にはテキスト生成系AI「ChatGPT」にも活用されている自然言語処理モデルの元祖となる「GPT-1」を公開しています。
2019年11月、2020年6月、2023年3月には、それぞれGPT-1の上位モデルとなる「GPT-2」「GPT-3」「GPT-4」が公開されました。
2022年11月30日に、GPT-3.5 turboモデルをベースとするチャットボット(対話型AI)の「ChatGPT」を正式に発表しました。2023年2月に開始された有料プランのChatGPT Plusと法人向けChatGPT EnterpriseChatでは、最新モデルのGPT-4の利用が可能です。
他にも、テキストから画像を生成するAIモデル「DALL E」を2021年1月にリリースし、2022年4月に次のモデルとなる「DALL・E 2」、2023年10月には「DALL・E 3」を発表しています。また、2022年9月に発表された「Whisper」は、2023年現在有償API版と無償オープンソース版が提供されています。
OpenAIが注目されている理由
OpenAIが注目されている理由は、近年、AI技術の発展が著しく、人々の暮らしや企業のビジネスにもAIを取り入れようという動きが広まってきていることにあります。中でもOpenAIが開発したテキスト生成系AIの「ChatGPT」は注目度が高く、2022年3月に一般公開されてから、わずか1週間に満たない速度で100万人もの利用者を突破しました。
さらに一般公開2か月後には利用者数が1億人を突破するなど、他のクラウドサービスと比較しても類を見ないスピードで浸透し続けています。
ChatGPTの導入によって、定型作業の効率化やアプリケーション開発への組み込みなど、企業のビジネス効率化を図ることができると期待されています。例えばチャットボットにChatGPTのAIを組み込み、ユーザーからの問い合わせや社内ヘルプデスクを自動化するなど、さまざまな使い方が考えられます。
このようにOpenAIでは、テキスト生成系AIをはじめとして、画像生成系AIや音声生成系AIなど、さまざまなAIモデルを開発・公開しています。世間におけるAIへの注目度が高まっているからこそ、OpenAIにも注目が集まっているのです。
OpenAIが提供するAIサービス
OpenAIが提供するAIサービスには、次のようなものが挙げられます。
- ChatGPT
- DALL・E
- Whisper
- OpenAI Codex
OpenAIは分野の異なるさまざまなAIサービスを提供しています。自社の環境に合わせてどのAIサービスを導入すれば良いのかを見極めることで、よりスムーズに社内の業務効率化や、開発の省力化を図ることが可能です。
ここでは上記の4つのサービスについて、概要や特徴、どのようなデータを生成できるのかについて解説します。
ChatGPT
ChatGPTは、前述の通りテキスト生成系AIです。入力されたデータに対して、まるで人間が返答しているかのような自然な文章が出力されるのが特徴で、アカウントを作成すれば、基本料金無料で使用できます(有料プランあり)。
例えば「りんごを英語で言うとどんな単語?」と聞いた場合、ChatGPTは「りんごを英語で言うと”apple”となります。」と返してくれます。このように文章の流れがスムーズで、一見すると人間が作成しているかのように思えるような、高精度な文章を作成可能です。
レポートなどの文章の要約などにも長けており、ビジネスへの活用が大いに期待されるAIサービスです。
ただし、ChatGPTは2021年までのデータしか学習していないため、リアルタイム性の高いデータや、比較的最近登場したばかりの単語などについて聞いても、回答できない点に注意が必要です。
2023年3月には「GPT-4」のリリースが発表され、有料プランのChatGPT Plusもしくは企業向けのChatGPT EnterpriseChatでのGPT-4利用を開始しました。7月には、有料版「ChatGPT API」の全ユーザーに向けてGPT-4へのアクセスが提供され、より幅広い人がGPT-4を使用できるようになっています。
なお、ChatGPTは2021年までのデータしか学習していないため、リアルタイム性の高いデータや最近の単語などに回答できませんでしたが、2023年9月に、マイクロソフトの検索エンジンBingを通して、ChatGPTがインターネットを閲覧できるようになったと発表しています。
また、2024年5月に最新モデルである「GPT-4o」のリリースが発表されました。主に英語以外のテキスト・音声の理解スピードがアップし、人間との会話と同じレベルのスピードで応答が可能になりました。
ChatGPTについて詳しくはこちらの記事もご覧ください。
ChatGPTとは?使い方や始め方、日本語対応アプリでできることも紹介!
GPT-4について詳しくはこちらの記事もご覧ください。
GPT-4とは?特徴やできること・GPT-3.5との違いを事例で徹底比較!
GPT-4oについて詳しくはこちらの記事もご覧ください。
OpenAI、音声と視覚の理解に強みを持つ新モデル「GPT-4o」発表。無料版でも利用可能
GPTsとは?
「GTPs」は、ChatGPTのチャット機能を使ってカスタマイズができる機能です。2023年11月6日に開催されたOpenAI社の公式イベントにおいて、ChatGPTの新機能として発表されました。
GPTsにより、自分だけの「AI搭載オリジナルチャットボット」をチャット上でのやり取りだけで作成できるようになります。また、チャットボットの名前やアイコンも、作成を依頼することが可能です。
例えば、企業が特定の社内用途に使う生成AIをカスタマイズすることで、社内データベースを効率的に活用できます。また、用途に合わせた生成AIに業務という方向性を示し、社員がAIを使いやすくなることも期待できます。
GPTsが装備されれば、アプリ構築やAIに関する知識不要でAIをカスタマイズすることができます。
DALL・E
「DALL・E」は、テキストボックスに出力したい画像のイメージを入力して指示すると、送信した内容に基づいて画像に変換してくれる画像生成系AIです。2023年4月現在、日本語での指示には対応していないため、新規画像を生成するには英語で生成したい画像の内容を指定する必要があります。
DALL・Eは、テキストの指示次第で、リアルの世界であれば存在しないテーマの画像を自由に生成することができます。例えば「ゴッホ風の犬」や「モネ風のウサギ」など、自由な発想で新たな画像を生成可能です。
ビジネスにおけるDALL・Eの活用法としては、自社の新規ビジネスのアイディア出しや、Webコンテンツの素材としての画像生成などが考えられます。
最新モデルの「DALL・E 3」が2023年9月にリリースされ、10月からはMicrosoft Bingの「Image Creator」「Bing Chat」で利用がスタートしています。また、ChatGPTの有料プランChatGPT Plusでも使用可能で、日本語のプロンプトにも対応しています。
DALL-E 3については下記記事もご覧ください。
DALL-E 3とは?Bing Image Creatorの使い方や品質を高めるコツを解説
Whisper
Whisperは、入力した音声データをもとに、文字起こしを行うツールです。インターネット上に存在する680,000時間もの音声データを学習しており、多種多様な音声データに対応しています。
例えば、少人数の会話やビジネスにおける会議、セミナー、講演会、歌唱などの録音データをWhisperに読み込ませるだけで、簡単にテキストデータを生成できます。これまでは音声を聴きながら手作業でテキスト化しなければならなかった音声データを簡単にテキストデータ化できるため、コールセンターなどの業務効率化にも大きく貢献できます。
また、今のところ精度はそれほど高くありませんが、文字起こしを行ったテキストデータを、日本語から英語など、他の言語へ翻訳する処理も可能となっています。
2023年3月には誰でも使用可能なWhisperのAPIが公開され、アプリ開発などに手軽に組み込めるようになりました。
WhisperをAPI経由で利用する料金は1分あたり$0.006で、日本円換算だと1時間で約50〜60円です。また、Google ColaboratoryかGitHubのオープンソースを使えば、無料で利用できます。どちらの場合でも、利用前に実行環境を準備する必要があります。
OpenAIの文字起こしAI「Whisper」の使い方を見る
OpenAI Codex
「OpenAI Codex」はテキストで指示を書くだけで必要なコードを教えてくれるAIです。現時点ではベータ版を無料で利用することができます。対応しているプログラミング言語は幅広く、Pythonをはじめ、JavaScript、Go、Perl、PHP、Ruby、Swift、 TypeScript、SQL、Shellなど幅広い言語に対応しています。
高度なコーディングが可能であり、Webアプリケーションなどの開発補助として活用すればプログラマーの作業効率が上がると期待されています。2021年8月には、非公開ベータ版のCodex用APIをリリースしました。
CodexはGPT-3モデルの系統でしたが、2023年3月には非推奨(サポート終了)となり、GPT-3.5以降が推奨されています。
OpenAIのAIサービスの使い方
OpenAIが公開しているAIサービスに興味があり、実際に使ってみたいという方も多いでしょう。
まだ一度も使ったことがない方のために、テキスト生成系AIのChatGPT、画像生成系AIのDALL・E、音声生成系AIのWhisperの3つのAIサービスについて、簡単な使い方を紹介します。
どのようなデータを出力できるのかも併せて解説しますので、これからAIサービスを初めてお使いの方はぜひ参考にしてください。
ChatGPTの使い方
テキスト生成系AIのChatGPTは、ユーザーが入力したテキストの内容に対して、AIが適切な回答を文章で出力してくれるAIサービスです。ChatGPTを使うには、次の手順で登録を行います。
-
- ChatGPTの公式サイトにアクセスする
- 上記のトップ画面左下にある「Try ChatGPT」をクリックする
-
- ログイン画面が表示されたら、右側の「Sign up」をクリックする
- 任意のメールアドレスまたはGoogleアカウント、Microsoftアカウントを使って新規ユーザーアカウントを作成
- 必要情報を入力して新規アカウントを作成すると、ChatGPTの使用準備は完了です。
さらに詳しくChatGPTの使い方やできることについて知りたい方は、下記の記事もご覧ください。
ChatGPTとは?使い方や始め方、日本語でできることを紹介!
DALL・Eの使い方
DALL・Eは画像生成系AIで、入力したテキストの情報を送信すると、テキストの内容に基づいた新たな画像を生成できるのが特徴です。DALL・Eを使うためには、下記の要領でユーザー登録が必要です。
-
- DALL・Eの公式サイトにアクセスする
- 上記のトップ画面左下にある「Try DALL・E」をクリックする
- ログイン画面が表示されたら、中央の「Sign up」をクリックする
- 任意のメールアドレスまたはGoogleアカウント、Microsoftアカウントを使って新規ユーザーアカウントを作成する
- 必要情報を入力して新規アカウントを作成すると、DALL・Eの使用準備は完了です。
さらに詳しくDALL・Eの使い方やできることについて知りたい方は、下記の記事もご覧ください。
DALL·E 2の使い方 文字を入れるだけで使える話題の画像生成AIを試してみた!
Whisperの使い方
Whisperは音声生成系AIで、ユーザーが入力した音声データの内容をテキストデータに変換・出力する機能を持つAIサービスです。Whisperは2023年4月現在、無料のAPIが公開されていますが、まずはどのようなサービスなのか試してみたい方は、「Hugging Face」の体験版がおすすめです。
Hugging FaceでWhisperを利用する方法は、次の通りです。
- Hugging Faceの公式サイト(https://huggingface.co/spaces/openai/whisper)にアクセスする
- 上記のトップ画面左下にある「Record from microphone」をクリックする
- マイクの許可を求められるので、「許可する」をクリック
- マイクに向かって、テスト用の任意の音声を話す
- 右側の「Transcribe」をクリックする
さらに詳しくWhisperの使い方やできることについて知りたい方は、下記の記事もご覧ください。
OpenAIが見据えるAGI開発のリスクと利点
AGIの開発は人々の生活やビジネスに革命を起こす可能性がある、希望に満ちた取り組みではありますが、高い将来性を秘めています。その反面、誤用や社会的混乱、予期せぬトラブルなどのリスクが伴うため、正しい開発方法を見つけ出すことが大切です。
OpenAI社のサム・アルトマンCEOは、2023年2月24日に「汎用人工知能(AGI)についての展望」というロードマップを発表しました。その中で、AGIが「人間よりも賢いAI」であることを前提とした上で、誤用を防ぎ、正しい開発を行う必要があると示しています。
また、長期的な視点で見ると、AGI構築によってAIが人類の未来を決めるような事態にならないためにも、「人間社会にAGIが適応するための時間を設ける必要がある」と語られています。
「2045年問題」と呼ばれるシンギュラリティ(技術的特異点)の訪れにより、人間の仕事がAIに奪われる可能性や機械と人間の境目が曖昧になっていくリスクも懸念されています。人間とAIの共存を目指し、明確な対策やルール整備が必要です。
OpenAIと日本の関係性
2023年4月10日、サム・アルトマンCEOが来日した際に、AI開発による革命には日本が重要な役割を果たすと語りました。将来のAI活用に向けて、日本政府や関係者と連携していく必要があると考えていたと言います。
5月には日本の岸田文雄首相と会談を行い、日本での活動拡大について積極的な姿勢を見せました。その後、6月には、OpenAIが日本拠点の設立にTwitter日本法人の元代表James Kondo氏を採用したと発表しています。
サム・アルトマン氏は、日本政府によるAI技術の採用の可能性も示唆しており、OpenAI社は日本市場への進出を本格的に視野に入れていることがわかります。
OpenAI まとめ
2015年に設立されたOpenAIは、テキスト生成系AIの代表とも言える「ChatGPT」をはじめ、画像生成系AIの「DALL・E」、音声生成系AIの「Whisper」など画期的なAIサービスを次々と生み出しています。
2023年10月からは、ChatGPTの有料プランで最新モデルのGPT-4やDALL・E 3が利用できるようになるなど、技術の進化と利便性の向上が加速しています。
AIは世界に技術革命を起こす可能性がある一方で、社会の適応が追いつかず、重大な混乱を招くリスクも抱えています。AIの開発者は、社会の適応に合わせて開発速度を意図的に落とすなどの配慮が必要です。
日本においては、OpenAI社が政府の連携を示唆するなど、国にとって重要な立ち位置となる可能性もあります。AI活用のルールや人間との境界線の明確化といった課題対策の重要性も高まっていくと考えられます。
AIsmileyでは、OpenAI社やAIサービスに関する最新ニュースなどさまざまな情報を紹介しています。自社に適したAIサービスを検討する上で役立つ情報も多数発信していますので、ぜひご活用ください。
AIについて詳しく知りたい方はこちらの記事もご覧ください。
AI・人工知能とは?定義・歴史・種類・仕組みから事例まで徹底解説
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI・人工知能記事カテゴリ一覧
AI・人工知能サービス
- 生成AI
- 画像生成AI
- ChatGPT
- AI研究開発
- LLM
- DX推進
- おすすめAI企業
- チャットボット
- ボイスボット
- 音声認識・翻訳・通訳
- 画像認識・画像解析
- 顔認証
- AI-OCR
- 外観検査
- 異常検知・予知保全
- 自然言語処理-NLP-
- 検索システム
- 感情認識・感情解析
- AIモデル作成
- 需要予測・ダイナミックプライシング
- AI人材育成・教育
- アノテーション
- AI学習データ作成
- エッジAI
- IoT
- JDLA
- G検定
- E資格
- PoC検証
- RPAツール
- Salesforce Einstein
- Watson(ワトソン)
- Web接客ツール
- サプライチェーン
- メタバース
- AR・VR・デジタルツイン
- MI
- スマートファクトリー
- データ活用・分析
- 機械学習
- ディープラーニング
- 強化学習
- テレワーク・リモートワーク
- マーケテイングオートメーション・MAツール
- マッチング
- レコメンド
- ロボット
- 予測
- 広告・クリエイティブ
- 営業支援・インサイドセールス
- 省人化
- 議事録自動作成
- 配送ルート最適化
- 非接触AI
業態業種別AI導入活用事例
今注目のカテゴリー
AI製品・ソリューションの掲載を
希望される企業様はこちら