この記事の情報は、2024年6月10日現在の最新情報をまとめております。
ChatGPTを開発したOpenAI社が、2024年5月にChatGPTの新モデルGPT-4o(ジーピーティーフォーオーオムニ)を公式リリースしました。
ChatGPTを使う際は、既存のGPT-4ではなくChatGPT-4oを使うのが最適です。
ChatGPT-4oは、今までのChatGPTと比べてさまざまな性能がアップデートされており、SNSでも話題になっているChatGPTモデルです。従来の無料版のChatGPTと比べてChatGPT-4oでは使える機能が増えたこと、APIの料金が安くなったことで注目を集めています。
GPT-4oはリリースされたばかりのため、どのような機能があるのか把握できていない方もいるのではないでしょうか。
そこで、本記事では、ChatGPT-4oの使い方や機能、料金、活用例を解説します。
ChatGPTの概要やビジネスシーンでの活用例が気になる場合は、以下の記事も参考にしてみてください。
ChatGPT-4o(ジーピーティーフォーオーオムニ)とは
ChatGPT-4o(ジーピーティーフォーオーオムニ)は、生成AI「ChatGPT」を開発したOpen AI社が2024年5月にリリースした、ChatGPTの新しいモデルです。
ChatGPT-4oの「o」は、すべてを意味する「omni(オムニ)」の頭文字を取って付けたものです。
この「o」で、さまざまな形式のデータの読み取りや出力が可能になったこと、言語能力の向上など、多岐にわたって性能がアップデートされていることを表しています。
ChatGPTはテキストベースの生成AIとして開発されたもので、ユーザーが入力した質問を読み取り、その内容に対して自然な対話形式のテキストを生成する、AIチャットサービスでした。
しかし、ChatGPTのモデルは新しくなると、テキストの生成・読み取りだけではなく画像の読み取りや生成も可能になりました。このように、入力したテキストに対して画像を生成して回答したり、画像を読み取ってテキストを生成して返答したりする機能のことをマルチモーダル機能と呼びます。
マルチモーダル機能は、もともとGPT-4の初期モデルでは画像を読み取ってテキストを生成するだけでした。しかし、GPT-4oにアップデートされたことで、動画や音声を読み取ってテキストを生成したり、音声を読み取って音声を生成したり、とマルチモーダル機能がさらに向上しました。
これらの機能の進展から、ChatGPTを使う際は従来のGPT-4ではなくChatGPT-4oを利用するのが一番です。
充実した機能が使えるChatGPT-4oの活用によって、さらに手軽に生成AIが利用できるようになるため、業務の効率化や生産性の向上が期待できるでしょう。
ChatGPT-4oの利用料金は無料?
ChatGPT-4oは、回数制限はあるものの、ChatGPT無料版でもChatGPT Plus(有料版)でも利用できます。
利用できる回数の目安は、ChatGPT無料版では3時間ごとに10回、ChatGPT Plus(有料版)では3時間ごとに80回です。
ChatGPT無料版とChatGPT Plus(有料版)で、それぞれ使える機能は以下のとおりです。
今回のアップデートにより、ChatGPT無料版で使える機能が増えています。
利用項目 | ChatGPT 無料版 | ChatGPT Plus(有料版) |
---|---|---|
ChatGPT-3.5の利用 | ○ | ○ |
ChatGPT-4の利用 | × | ○ |
GPT-4oの利用 | ○(3時間ごとに10回) | ○(3時間ごとに80回) |
Webブラウジング機能 | × ⇒ ○ | ○ |
マルチモーダル機能 | × ⇒ ○ | ○ |
画像認識 | × ⇒ ○ | ○ |
音声対話 | ○ | ○ |
部分指定機能(Reply機能) | ○ | ○ |
パーソナライズ記憶機能 | ○ | ○ |
ソースコード生成 | × ⇒ ○ | ○ |
ソースコード実行・修正 | × ⇒ ○ | ○ |
画像生成 | × | ○ |
画像部分編集 | × | ○ |
MyGPT作成 カスタム指示 | × | ○ |
MyGPT作成 Knowledge学習(モデル構築) | × | ○ |
MyGPT作成 Web-browsing機能利用 | × | ○ |
MyGPT作成 画像生成機能利用 | × | ○ |
MyGPT作成 ソースコード生成機能利用 | × | ○ |
MyGPT作成 外部サービスとの連携 | × | ○ |
MyGPT作成 既存GPTの複製 | × | ○ |
MyGPT作成 バージョン管理 | × | ○ |
MyGPT利用 単一利用 | × ⇒ ○ | ○ |
MyGPT利用 メンションでの複数組み合わせ利用 | × ⇒ ○ | ○ |
MyGPT共有 リンク共有 | × | ○ |
MyGPT共有 GPT Store | × ⇒ ○ | ○ |
多要素認証 | ○ | ○ |
モデル学習の禁止設定 | ○ | ○ |
サードバーティのGPT利用禁止設定 | × | × |
作成したMyGPTの公開範囲制限 | × | × |
ユーザー毎のロール設定 | × | × |
※「× ⇒ ○」は、今回のアップデートにより使えるようになった機能。
ChatGPT無料版でもChatGPT Plus(有料版)でもChatGPT-4oで使える機能が増えているため、従来のバージョンではなくChatGPT-4oを利用するのが最適です。
また、ChatGPT Plus(有料版)の詳しい料金が気になる場合は、以下の記事も読んでみてください。
なお、GPT-4oでは、ChatGPTのAPIの利用料金も今までと比べて金額が安くなっているため、今後は利用者が増えることが予想されるでしょう。
料金の詳細が気になる方は、OpenAI社の公式ページ「API Pricing」からご確認ください。
さらにChatGPTのAPIを知りたい方は、以下の記事も参考にしてみてください。
ChatGPTの追加機能:部分指定機能(Reply機能)
ChatGPTの新機能として、ChatGPT-4oをはじめとする全てのChatGPTモデルに部分指定機能(Reply機能)が追加されました。(2024年6月10日時点)
部分指定機能とは、ChatGPTの回答内容のうち選択した部分に対して追加でプロンプトを送付できる機能です。
ChatGPTが出力した回答内容をさらに深掘りしたい場合に使えます。
改めて質問する時間や手間など今までかかっていたプロセスが省けるため、業務の生産性向上に重宝します。
たとえば、PDFで要約した文章のある部分の情報を詳しく知りたい場合に、追加プロンプトを送る方法は以下のとおりです。
追加でプロンプトを送付したい箇所をマウスでドラッグし、表示される記号「”」(Reply)を左クリックします。
プロンプト入力欄の上に、選んだ箇所の文章が表示されていることを確認してください。
プロンプト入力欄に追加の指示文を入力して送信します。
指示したとおりに、選択した箇所の内容を詳しく説明してくれました。
ChatGPTの機能は、ここ一年だけでも着々と発展しています。いち早くChatGPTの機能を使いこなせるようになることで、今後さらに業務の効率化が進められるでしょう。
ChatGPT-4oの使い方
ChatGPT-4oの使い方には、以下の4種類があります。
それぞれの使い方を確認していきましょう。
GPT-4oの使い方1:ChatGPT無料版
アカウントを持っている場合はこちらのリンクからChatGPTのログインページに進んでください。
アカウントの作成やログインする方法がわからない場合は、以下の記事から手順をチェックしてみてください。
ログインしたら、新しく会話をスタートさせましょう。
ChatGPTから回答が出力された後、左下にある一番右側のアイコンをクリックしてください。
利用できるChatGPTモデル名が表示されます。選択されているのがGPT-4oであれば、GPT-4oが利用できます。
GPT-4oの使い方2:ChatGPT Plus(有料版)
ChatGPT無料版と同様、こちらのリンクからChatGPTにログインしてください。
アカウントの作成やログインする方法がわからない場合は、以下の記事から手順をチェックしてみてください。
ログインしたら、左上に表示されたChatGPTモデル名をクリックしましょう。
利用できるChatGPTモデル名が表示されます。選択されているのがGPT-4oであれば、GPT-4oが利用可能です。
GPT-4oの使い方3:ChatGPTスマホアプリ版
ChatGPTのスマホアプリを開いてください。スマホアプリの始め方がわからない場合は、以下の記事から詳細が確認できます。
画面の上部に表示されたChatGPTモデル名をタップしてください。
使えるChatGPTモデル名が表示されます。選択されているのがGPT-4oであれば、GPT-4oが利用できます。
GPT-4oの使い方4:Azure
Azure OpenAI Studioの「Early Access Playground」から、GPT-4oが使用できます。
ただし、現在は米国西部3または米国東部に該当する地域でのみ利用可能で、日本では使えません。また、今回のバージョンは正式にリリースされたサービスではなく、開発中の段階の状態です。
Azureの利用回数はサブスクリプションあたり5分ごとに10件に限られています。正式にリリースされたバージョンではないため、直接APIにはアクセスできない点も注意が必要でしょう。
なお、日本マイクロソフト株式会社から、正式にAzure上で開発中の段階の状態のものが使用できることがリリースされています。
【 GPT-4o の発表:Azure 上でプレビュー開始】#OpenAI の新しいフラッグシップモデルである GPT-4o が、 #Azure #AI 上から利用できることを嬉しく思います。このマルチモーダルモデルは、テキスト、視覚、音声の機能を統合し、次世代の #生成AI 体験をもたらします。https://t.co/9Zsd5IcjyD
— 日本マイクロソフト株式会社 (@mskkpr) May 14, 2024
参考:Microsoftの公式ページ「Azure OpenAI Service models」
ChatGPT-4oでできること・GPT-4との違い
ChatGPT-4oでできるようになったこと・GPT-4との違いは以下5つです。
それぞれの機能を確認していきましょう。
ChatGPT-4oの特徴1:回答精度・速度の向上
GPT-4oでのテキスト上の会話は、ChatGPT-4と比べて、高い回答精度で約4倍速く回答できるようになりました。(当社比)
また、音声入力した場合でも、GPT-4oは平均320mm秒、最短232mm秒という速さで迅速に回答を出力してくれます。この速度は、対人間での応答の速さに近いため、さらに円滑で自然な対話が可能になっているのが特徴です。
なお、Open AI社から発表されている、ChatGPTのモデルごとのテキスト性能の評価は以下のとおりです。
ChatGPTモデルごとのテキスト性能の評価一覧
評価項目の説明
・MMLU(Massive Multitask Language Understanding) (%):多くのタスクにわたる言語理解能力
・GPCQA(General Purpose Commonsense Question Answering) (%):一般常識に基づく質問応答能力
・MATH (%):数学問題の解答能力
・HumanEval (%):コード生成の正確さ
・MGSM (Multi-Step Arithmetic Reasoning)(%):複数のステップでの算術推論能力
・DROP(Discrete Reasoning Over Paragraphs) (f1):段落にわたる離散的な推論能力
DROP以外の項目は、GPT-4oが評価が高いことがわかります。そのため、テキストで会話する際は従来のモデルではなくChatGPT-4oを利用するのが一番だと言えるでしょう。
ChatGPT-4oの特徴2:画像生成・文字認識機能の強化
ChatGPT-4oでは、日本語の文字認識の精度が向上し、従来では苦手としていた複雑な資料や手書きの画像からの読み取りの機能が強化されています。
また、今まで同じ画像を生成する際、違う画像を生成するなど整合性がとれなくなってしまうケースがありましたが今回のバージョンアップにより一貫性が保たれるようになりました。そのため、画像を使ってマンガ形式で説明する場合など、視覚的に内容を説明・理解する際に役立てられるようになっています。
なお、Open AI社から発表されている、AIモデルごとの画像の視覚認識評価は以下のとおりです。
各評価項目ごとにパーセンテージ表記されており、数値が高ければ高いほど性能も高いことを示しています。
AIモデルごとの画像の視覚認識評価一覧
この表では画像の生成や読み取りはGPT-4oの性能評価が高いため、今までのAIモデルではなくChatGPT-4oを使うのが一番であることがわかります。
ChatGPT-4oの特徴3:よりスムーズな音声対話
ChatGPT-4oで音声対話をする際、平均0.3秒の速度で回答できるようになりました。この速度は人間が応答した場合と比べてもほとんど差がない速さです。また、GPT-4の音声対話の回答平均速度は5.4秒のため、アップデートにより回答速度が速くなっていることがわかります。
また、従来のChatGPTでは話がすべて終わらないと、次の会話に進めませんでした。しかし、GPT-4oでは対話中の割り込みができるようになったため、さらにスムーズな対話が可能になっています。
なお、GPT-4oでは、話し手を区別して発言を文字起こししたり、即座に同時通訳したりすることもできるようになりました。そのため、議事録の作成や多言語での打ち合わせの記録にも重宝するでしょう。
さらに、GPT-4oは話し手の感情の分析も可能になりました。話し手の声の調子や発言から、その話し手が意見に肯定的なのかなどを推測できます。この機能により、打ち合わせ時の雰囲気や出席者のリアルな反応まで記録できるでしょう。
今までの議事録作成に使えるAIツールは、文字起こしがメインでした。しかし、GPT-4oは話し手の識別や多言語の同時通訳、感情分析まで可能になりました。そのため、その会議の背景や周辺の状況がよりわかりやすい議事録が作れます。会議内容の理解を深めることで、次の施策検討に役立てられるでしょう。
以下の表は、Open AI社から発表されている、音声認識(ASR)の性能と翻訳精度の比較表です。
音声認識は数値が低いほど性能が優れていることを表しており、GPT-4oの評価が高いことがわかります。
Whisper-v3とGPT-4o(16-shot)の音声認識一覧
一方、音声翻訳は数値が高いほど性能が優れていることを示しています。Open AI社以外が開発しているAIモデルと比べても、GPT-4oの性能が高いことがわかります。
AIモデルごとの音声翻訳性能一覧
ChatGPT-4oの特徴4:日本語に関する性能の向上
従来のChatGPTは、英語のデータでAIが学習していたため、英語と比べると日本語などの他の言語での対応は十分ではないところがありました。
しかし、今回のGPT-4oでは、多言語によるデータを使ってAIが学習しているため、英語以外の言語に関連する性能が向上しています。とくに、日本語における性能は大幅にアップデートされているようです。
ChatGPT-4oの特徴5:デスクトップアプリの利用
ChatGPT-4oでは、デスクトップアプリの利用が可能です。
そのため、ショートカットですぐにChatGPTを呼び出せたり、ファイルをすぐにChatGPTにインプットできたりするほか、以下4つの便利な機能が使えるようになりました。
ChatGPTが人間の会話の割り込みを受け入れられるようになったこと、画面共有+リアルタイム動画認識+話者識別が可能になったことが、ChatGPT-4oのデスクトップアプリの大きな特徴です。
また、これらの機能によってChatGPTが人間と対等に会議に参加できるようになりました。
そのため、ChatGPTを活用した、効率的な話し合いや議論、会議中の議事録作成の実現が期待されています。
以下の動画は、人間4人がChatGPTとWeb会議を行っているOpenAI社の実演動画です。
また、画面共有しながらChatGPTと議論するシーンも、OpenAI社の公式動画で紹介されています。
このようにChatGPTの機能が活躍できる場面が増えているため、従来のChatGPTモデルではなくChatGPT-4oを使うのが一番効率的に業務をこなせるでしょう。
ChatGPT-4oの活用例
ChatGPT-4oの活用例は、以下のとおりです。
実際に使えるよう、それぞれの活用例をチェックしていきましょう。
ChatGPT-4oの活用例1:Google DriveやOneDriveとの連携
ChatGPT-4oでは、Google DriveやMicrosoft OneDriveとの連携が可能になりました。そのため、保存されているドキュメントやスプレッドシートなどのデータを直接ChatGPTにアップロードできるようになっています。
ChatGPTにこれらのデータを読み込ませることで、関係する質問をしたり内容をまとめてもらうなど、さまざまなタスクをChatGPTにお願いしやすくなるのがメリットです。
具体的な利用手順は、以下のとおりです。
まず、ChatGPTログインしてください。ログイン後に表示される右上のアイコンをクリックします。
次に、表示されるメニューの中から「設定」を選びます。
左側に表示されるメニューの中から「接続するアプリ」をクリックしてください。
連携したいクラウドストレージサービスの右横に表示されている「接続する」を選ぶと、連携に進みます。
連携するアカウントを選択します。
アカウントへのアクセス許可確認の画面が表示されたら、「続行」をクリックしてください。
NewChat画面左下のクリップアイコンをクリックして、連携したクラウドストレージサービスが表示されれば、設定完了です。
連携を停止したくなった場合は、「設定」の「接続するアプリ」から「切断」を選ぶと連携が解除されます。
ChatGPT-4oの活用例2:グラフ生成
ChatGPT-4oを利用して、円グラフをはじめとした9種類のグラフ生成方法がSNSで紹介されています。
グラフ生成においても、従来のChatGPTと比べると性能が向上していることがわかります。
【ChatGPTでのグラフ生成が大幅進化】
— チャエン | 重要AIニュースを毎日発信⚡️ (@masahirochaen) May 26, 2024
気づいたら、グラフの細かい色まで変えれるように。
GPT-4oになってから更に使いやすく。
○解説note↓https://t.co/3SSOm6a5Gf
今回はChatGPT最新モデルGPT-4oを使った9種類のグラフ作成方法を徹底解説したnoteを作りました。… pic.twitter.com/fOZY5suX90
ChatGPT-4oの活用例3:PDF画像からグラフ生成
画像認識機能が向上したChatGPT-4oでは、PDF画像の読み取りによってグラフ生成が可能です。
以下のSNSの投稿では、グラフ生成時のプロンプト、さらにgif形式での出力をChatGPTにお願いしています。
この投稿から、ChatGPTはgif形式でも回答を生成できることがわかります。
完全に実験的にやってみたけど、PDFの画像からグラフ作れてgifでビジュアル化まで出来た!
— あやみ|LayerX (@ayami_marketing) May 23, 2024
GPT-4oのポテンシャルはもっと全然、引き出せるはず… pic.twitter.com/wb2GpJXkRe
ChatGPT-4oの活用例4:リアルタイムでの言語翻訳
リアルタイムで言語翻訳をする場面でも、ChatGPT-4oを活用できます。
以下のXの投稿では、使っている言語とは別の言語で即時に翻訳されている様子が紹介されています。
OpenAI demos real-time language translation with its latest GPT-4o model. pic.twitter.com/pXtHQ9mKGc
— TechCrunch (@TechCrunch) May 13, 2024
ChatGPT-4oの活用例5:ショート動画の作成
ショート動画の作成時にも、ChatGPT-4oが重宝します。
以下の投稿では、GPT-4oを活用したショート動画が紹介されています。GPT-4oはショート動画のストーリーとプロンプト作成に用いられているようです。
20分で出来るショート動画。
— ないと|AIイラストを教えるプロ (@nikdjapan) May 20, 2024
①GPT4oでストーリーとプロンプトを考えてもらう。
②Midjourneyで画像生成
③Gen2のモーションブラシで画像を動かす
④caupcutで動画編集
ちなみにGPT4oに作りたい動画のキーワードを入れるだけで、考えてくれるプロンプトを作成しているので、再現性バッチリ! pic.twitter.com/m15bfMO9IF
ChatGPT-4oの活用例6:figmaデザイン
ChatGPT-4oを使うことで、figmaのデザインができるようになりました。
実際にGPT-4oを利用してfigmaでデザインしている様子が、SNSで投稿されています。今後、デザイン生成の業務効率化にもGPT-4oが重宝するでしょう。
GPT-4oが完全自動でfigmaデザインをしている様子。(しかも要件に沿った形で)
— すぐる | ChatGPTガチ勢 𝕏 (@SuguruKun_ai) May 28, 2024
いや4oのポテンシャルすごない???pic.twitter.com/O8V77P8JuF
ChatGPT-4oの活用例7:広告バナーのテスト
ChatGPT-4oを使うと広告バナーのテストも可能です。そのため、バナーの効果を検証に必要な広告費が削減され、検証にかかる時間が少なく済む効果が期待できます。
以下のSNSの投稿では、ペルソナ設定から結果測定まで3ステップで解説されており、手軽に広告バナーのテストを行っている様子が紹介されています。
🚩 ChatGPTで「全自動ABテスト」してみた
— すぐる | ChatGPTガチ勢 𝕏 (@SuguruKun_ai) May 27, 2024
ㅤㅤ
これら広告バナーのCTR検証には、今までだと実際に媒体へ掲載する必要があったけど
ㅤ
① GPT-4oで1000人のペルソナをランダムに作成
② 人格の特徴とクリック理由を各自出力させる
③ 結果測定
ㅤ
これだけで無料の簡易ABテストできるようになる… pic.twitter.com/Ul9x1Ip6YS
ChatGPT-4oの活用例8:データ分析
データ分析する際にも、ChatGPT-4oが便利です。
以下の投稿では、Xのアナリティクスを分析する方法が紹介されています。いくつかステップはあるものの、難しい手順はありません。そのため、データ分析が苦手な方でも簡単に分析が行えるのがメリットです。
GPT-4oのエグすぎる使い方見つけてしまった。
— KEITO💻AIディレクター (@keitowebai) May 20, 2024
(こんな事出来たのか…)
1.XのアナリティクスをDL
2.GPT-4oにアップロード
3.表を展開してもらう
4.空白の部分削除してもらう
5.列を指定してフォロー1未満削除
6.列を指定してリツイート平均聞く
7.それ未満は削除… pic.twitter.com/qvN0uc9dIW
このようにChatGPTを活用できるシーンが増えているため、従来のChatGPTモデルではなくChatGPT-4oを利用して生産性を向上させていきましょう。
ChatGPT研修「BotCamp」の特徴
わたしたちが提供する「BotCamp」は、ChatGPT研修の使い方を初心者から学べる研修です。
・日々登場する新しいAIツールやGPTsに、インプットが追いつかない
・AIツールの選択肢が多すぎて、自分にとって最適なツールを見つけられない
・生成系AIが仕事にどう役立つのか、あまりイメージできない
・すでに業務にAIを取り入れているが、使い方が適切なのかわからない
・時間をかけて学習しても、投資対効果がよいのか分からない
・プロンプトエンジニアリングって難しそう。とっつきづらく感じている
このようなお悩みをお持ちの方におすすめです。
BotCampの特徴1:プロンプトを難しく考えずシンプルに捉える
生成AIからのアウトプットの質を高めるコツは、指示文を「端的に・具体的に」書くことです。
だらだらと長く書く必要はありません。プログラミングやシステムエンジニアリングのように、用語めいた難しい言葉を使う必要も一切ありません。
「プロンプトエンジニアリング」と聞くとやや学術的で高度な技術的理解が必要な印象を受けるかもしれませんが、Prompt Simpleという考え方で、誰でも最小限の労力で最大限AIパワーを活用する方法をお伝えします。
BotCampの特徴2:便利なGPTsを厳選して紹介
GPT storeにて日々増え続ける膨大なGPTsのうち、業務改革のインパクトが大きく重要なGPTsを厳選して紹介します。
業務の種類ごとに、どのGPTを使うべきか自分で考え判断できる応用力を身につけることができます。
BotCampの特徴3:Advanced Data Analysis(旧Code Interpreter)で「一億総データサイエンティスト」に
CSV、PDFなどのデータをアップロードした上で、ChatGPT上でPythonのコードを生成・実行できる機能「Advanced Data Analysis」を活用し、高度な専門性がなくても誰もがデータサイエンティストのようなモデル作成、データの予測ができるようになります。
BotCamp開催概要
開催日程 | 研修内容ページを確認 |
研修時間 | 9:00~17:00もしくは10:00-18:00 |
開催形式 | 対面のみ(オンライン参加不可) |
会場 | 水道橋開催の場合 コンフォート水道橋 東京都千代田区神田三崎町2-7-10 帝都三崎町ビル 2階,5階 https://www.relo-kaigi.jp/comfort-suidoubashi/access/ 神田開催の場合 BIRTH KANDA 東京都千代田区神田錦町1-17-1 神田髙木ビル7F https://birth-village.com/ |
備考 | ・ChatGPT(GPT-4)が入ったWindowsPCをお持ちください ・推奨のOSはWindowsです。Macでの受講はご遠慮ください。 ・セキュリティ上ChatGPTが使えないPCでの受講はご遠慮ください。 |