生成AI

最終更新日:2025/01/30
対話型AIが次々と開発されている中で、自分と相性がよいものを探しているけれど、「claude3」はどのようなものか知りたいという人はいませんか?
近年、対話型AIはカスタマイズ性が高い、回答を生成する速度が早い、回答を独自のまとめにしてくれるなど、少しずつ差別化が進んできています。
本記事では、claude3の使い方から無料で使う場合と有料で使う場合の違いまで詳しく解説します。
ChatGPTについて詳しく知りたい方はこちらをご覧ください。
ChatGPTとは?使い方や始め方、日本語対応アプリでできることも紹介!
Claude3とは大規模言語モデル(LLM:Large Language Model) の1つで、ChatGPTで言うとGPT-4oにあたる存在です。
2021年にアメリカで設立されたスタートアップ企業、Anthropic社によって開発されました。
最新モデルは2024年6月21日に発表されたClaude 3.5 Sonnetで、2024年10月23日にアップグレードが行われています。
日本語対応が行われているため、自然な文章で回答を生成できます。
参考:Anthropic「Claude 3.5 Sonnet」
Claude3の特徴を3つに分けて紹介します。
画像出典:Anthropic「Anthropic’s Responsible Scaling Policy」
Anthropic社では、AI安全レベル(ASL)というフレームワークでAIの安全性を定義しています。
ASLは以下の4つのレベルに分けられています。
レベル | 概要 | 例 |
ASL-1 | 壊滅的なリスクを引き起こす可能性がないシステム | 2018年頃のLLM(大規模言語モデル)やチェスだけをプレイするAIシステム |
ASL-2 | 危険な能力の初期兆候を示すシステム | 生物兵器の作り方に関する指示を提供できる能力があるものの、情報の信頼性が不十分であったり、検索エンジンなどで得られる情報と同等であったりする |
ASL-3 | 非AIのベースライン(例:検索エンジンや教科書)と比較して壊滅的な誤用のリスクを大幅に増加させるシステム
低レベルの自律性を示すシステム |
なし(まだ存在していないため) |
ASL-4以上(ASL-5+) | 現在のシステムからは遠い未来のものとして定義されており、まだ詳細は決まっていない | なし(まだ存在していないため) |
Anthropic社では最新モデルのClaude 3.5 Sonnetは、ASL-2に該当するとしています。
これはClaude 3.5 Sonnetが、今存在するモデルの中では最高の安全性を持っているということです。
一方、Anthropic社では許可がない限り、ユーザーが送信したデータで大規模言語モデルを学習させないと明言しています。
これらのことから、Anthropic社はAIを開発するにあたって、ユーザーの安全性やプライバシーを損ねないよう最大限の配慮をしているのがわかります。
参考:Anthropic「Claude 3.5 Sonnet」
参考:Anthropic「Anthropic’s Responsible Scaling Policy」
画像出典:Anthropic「コンピュータ利用、新作『Claude 3.5 Sonnet』、新作『Claude 3.5 Haiku』を紹介」
ベンチマークとはAIモデルの性能を評価し、比較するための指標です。
画像にある指標では、次のような内容を評価できます。
ベンチマークの種類 | 概要 |
GPQA | ・一般知識の質問応答能力を評価するベンチマーク ・知識の幅広さと正確さを測定する |
MMLU pro | ・大規模多言語理解ベンチマーク ・複雑な推論や多分野の知識をテストする |
HumanEval | ・プログラミングタスクを通じてAIのコーディング能力を評価する ・特にコード生成と正確さに焦点を当てる |
MATH | ・数学の問題解決能力を測るベンチマーク ・初等数学から高度な計算まで幅広くカバーする |
AIME2024 | ・数学に特化した試験形式のベンチマーク ・特に問題解決力と論理的思考を評価する |
MMMU | ・複数のモーダル(テキストと画像など)の理解を評価するベンチマーク ・統合的な推論能力を測定する |
SWE-bench Verified | ・ソフトウェアエンジニアリングのタスクにおける性能を評価するベンチマーク ・特に信頼性の高いコード生成に焦点をあてている |
TAU-bench | ・エージェンティックなツール使用能力を測定するベンチマーク ・特定ドメイン(小売、航空など)でのタスク解決力を評価する |
Claude 3.5 Sonnetは、他のモデルや以前のバージョンと比較してSWE-bench VerifiedとTAU-benchの値が特に高く、Claude 3.5 Sonnetの以前のバーションとの比較では7%~20%ほどアップしています。
このことから、Claude 3.5 Sonnetは一般的な課題解決に用いるだけではなく、専門知識が必要なコード生成や特定ドメインでのタスク解決でもその力を発揮できるといえます。
参考:Anthropic「コンピュータ利用、新作『Claude 3.5 Sonnet』、新作『Claude 3.5 Haiku』を紹介」
前の項目の表では、SWE-bench Verifiedの値が以前のバージョンと比較して15.6%上昇しています。
Claudeが開発された当初からの顧客からのフィードバックによると、このことによりClaude 3.5 SonnetはAIを活用したコーディングにおいて大きく進歩したとされています。
具体的な内容は以下の通りです。
フィードバックをした企業 | 内容 |
GitLab | 開発、セキュリティ、運用タスク向けにモデルをテストした結果、すべてのユースケースで最大10%の推論力向上を確認したが、遅延が大きくなっていない |
Cognition社 | 自律AI評価に利用したところ、前バージョンと比較してコーディング、計画、問題解決において大幅な改善が見られた |
Browser Company | Webベースのワークフロー自動化に使用したところ、これまでにテストしたどのモデルよりも優れている |
これらのことから、Claude 3.5 Sonnetはソフトウェアエンジニアリングの分野において、今後大きな力を発揮する可能性を秘めています。
参考:Anthropic「コンピュータ利用、新作『Claude 3.5 Sonnet』、新作『Claude 3.5 Haiku』を紹介」
Claude3では具体的にどんなことができるのでしょうか。例を3つ紹介します。
Claude3はテキストベースで以下のようなことができます。
一般的な質問回答や文章生成だけではなく、高度な推論や課題解決能力を必要とするシーンでClaude3はよりその力を発揮します。
Claude3は画像について次のようなことができます。
画像の内容をわかりやすく説明したり、分析したりできるので画像を用いた仕事を効率化できます。
Claude3は外部のツールと連携して以下のようなことができます。
Claude3は人間に対してだけではなく、外部ツールに対しても高いコミュニケーション能力を発揮していると言えます。
Claude3はアカウント作成をしてから使う必要があるため、登録方法を紹介します。
①Claudeのトップページにアクセスする
画像出典:Claude公式ホームページ
画面の右半分がデモ画面、左半分が登録画面となっているため、左半分に入力をして進みます。
②GoogleのアカウントかE-mailのアドレスで本人確認を行う
本人確認方法は、Googleのアカウントで確認する方法、E-mailのアドレスで確認する方法と2つあるのでどちらかを選択します。
③名前を入力し、利用規約に同意する
Claude内で使用する名前を入力し、安全に使うためのポリシーとそのレビューシステムの説明を確認してから次に進みます。
④使用する際の注意点と、利用制限や機能の変更についての説明を確認する
Claudeは時々誤った情報を提供することがあり、アドバイスをすることを目的としていません。
そのため、特に医療、法律、財務などの分野については出力される情報に頼りすぎないよう注意を促されます。
⑤利用開始
画像出典:Claude公式ホームページ
アカウントが作成され、Claudeが利用できるようになります。
それほど難しい手順ではないため、画面を確認しながら操作してみましょう。
画像出典:Claude「プライシング」
Claudeには画像のように無料、Pro、Team、Enterpriseの4つのプランがあります。
ProプランとTeamプランはホームページに金額が明記されていますが、Enterpriseプランだけは販売担当に連絡をして料金を問い合わせる必要があるため注意が必要です。
Claudeの料金プランは、1つ下のプランで使える機能に料金に応じて機能が追加される仕組みです。
例えば、Proプランの場合、無料プランの機能に加えて次のことができます。
無料でお試し利用した後、自分が欲しい機能はどのプランに含まれているかを考え、有料プランに切り替えることをおすすめします。
Claude3とChatGPTの違いを比較するため、次のような条件で実験をしてみました。
Claude3の要約には以下のような特徴があります。
ChatGPTの要約には次のような特徴があります。
Claude3とChatGPTは両方とも日本語対応はしているものの、日本で作られたAIではないため文語体を正確に理解するのは難しいかもしれません。
しかし、不正確な面はありながらもClaude3は知識の幅広さと正確さ、ChatGPTはユーザーに寄り添った回答を生成するというそれぞれの特技がわかる実験結果となりました。
Claude3とは、Anthropic社によって開発された大規模言語モデル(LLM:Large Language Model) の1つで、ChatGPTではGPT-4oにあたる存在です。
本記事も参考にして、ぜひClaude3を積極的に活用してみてください。
ChatGPTについて詳しく知りたい方はこちらをご覧ください。
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら