話題のChatGPT「GPT-3.」5と「GPT-4」をあれこれ比較

2023.08.10

投稿者: chiebo

IT界隈で今、一番ホットな話題といえば、文章生成AI「Chat GPT」でしょう。2023年3月には最新バージョンである「GPT-4」が公開されました。
前バージョンでも「世の中を変える」というぐらいのインパクトがありましたが、その上位バージョンは格段に性能が向上しています。
今回はこの2つのバージョンを比較してみましょう。

この記事でわかること
　・GPT-3.5とGPT-4の違いについて
　・GPT-4でできること
　・GPT-4でもまだできないことについて

GPT-3.5とGPT-4の違い

まずは公開されている情報を中心に、GPT-3.5とGPT-4の”カタログスペック”を比較してみましょう。

◯パラメータ数の違い

パラメータ数とは、Chat GPTが学習モデルを作成する段階で重要となるものです。当然ながら、この数が多いほど「良い学習モデル」を構築することができます。
また、良い学習モデルからは、より正確で信頼性の高い回答を生成することが期待されます。とても大雑把にいうなら、パラメーター数はChat GPTの「知識量」に関連するものです。

・GPT-3.5 1,750億（公開）　
・GPT-4 5,000億～100兆（非公開）

GPT-3.5のパラメータ数は、開発元であるOpen AIから公開されています。一方、GPT-4については非公開なため、あくまで推測値となっています。
単純にパラメータ数が2倍なら性能が2倍ということではありませんが、仮にGPT-4のパラメータ数が100兆だとした場合、約600倍ものオーダーになります。

ちなみに初代GPTは1.1億、GPT-2では15億のパラメータが使われていました。GPT-2からGPT-3.5へ1,000倍もジャンプアップしているところを見ると、GPT-4が100兆という驚愕の数値であっても、大げさとは言えないのかも知れません。
とりあえずGPT-4は、膨大なバックデータに支えられていることには間違いありません。

◯トークンの量

トークンとは、生成する文章の長さに関係する数値です。トークンの量が多ければ多いほど、Chat GPTは長い文章を生成することが可能です

・GPT-3.5 4,096トークン（英語換算で3,000語程度）
・GPT-4 8,192～32,768トークン（英語換算で6,000～25,000語程度）

GPT-3.5は無料で利用できますので、すでに試した方も多いと思いますが、プロンプトに入力した質問に対する回答は、日本語換算だと2,000語程度が限界です。
GPT-4ではこの部分が大幅に強化され、最大で25,000語（英語換算）もの文章を一度に生成することができます。
ちょっとしたレポートぐらいは書けてしまいますね。

教育機関などでChat GPTをどう使うか？がよくニュースで取り上げられていますが、確かに私が学生だったら真っ先に「悪用」してしまうかもしれません。

ここまでの比較でわかることは、使えるリソースが大幅に強化されたという事でしょう。

また、GPT-3.5では、一つのテーマについて繰り返し対話していくと、途中で話が逸れてしまうことがありました。これもGPT-4では改善され、対話しながらターゲットを絞り込み、より目的に沿った結果を出力できるようになっています。

◯回答の精度

開発元であるOpen AIが実施したテストによると、GPT-3.5で40～50%程度だった精度が、GPT-4では70～80%程度に向上しているとのことです。
この数値を一見すると、「あれ？精度低すぎないか？」と思ってしまいます。回答の精度が40%と言うと、話の半分以下です。

しかし、実際に使ったことのある人であれば、そんなにデタラメな回答ではなかったと思いませんか？
この数値は、Open AIが実施する特殊なテストに対する正確度であり、一般の人が普通に利用している状況とは異なります。ちょっと厳しめのテストと思えばいいでしょう。
40%という数値自体はとりあえず横に置いといて、GPT-4ではGPT-3.5の「倍ぐらい精度が向上している」と捉えると良いでしょう。

◯マルチモーダル対応

マルチモーダルとは、テキストや画像、音声など複数の異なるモダリティー（データ種別）に対応しているという意味です。GPT-3.5ではテキスト入力だけでしたが、GPT-4では画像の入力もできるようになりました。

例えば、手書きのメモをアップロードし、「このメモの内容でWebサイトを作るためのコードを出力してください。」という使い方ができるようになります。
絵画の説明を求めたり、数学の図形問題を解かせるといった使い方もいずれ可能になるでしょう。ただし、出力はテキストだけとなっています。*注1

◯料金

GPT-3.5は登録さえすれば誰でも無料で利用できます。しかしGPT-4は、月額20ドルのサブスクリプションを契約する必要があります。
毎月20ドルの価値があるかどうか、ちょっと悩ましいところです。契約はいつでも解除することが可能ですので、必要な時に1ヶ月だけ契約するということも可能です。

GPT-4でできる「こんなこと、あんなこと」

Chat GPTは、プロンプトに入力した質問に対して、自然な文章で回答してくれる「文章生成AI」です。非常に便利なツールですが、普通の『検索』とは異なる効果的な使い方は、人間の方で考えないといけません。
いくつかのユースケースを紹介しましょう。

◯司法試験の模範解答作成補助

GPT-4では、法律関係の精度が飛躍的に向上しています。
米国には「Uniform Bar Exam」という共通司法試験があり、GPT-3.5では受験者全体の下位10%程度の成績で、合格水準に達していませんでした。しかしGPT-4は400点満点に対し298点と、まずまずの成績を残しています。これは受験者全体の上位10%に入る水準です。

これなら、司法試験対策問題に対する模範解答作成のアルバイトぐらいはさせられそうです。もちろん全問正解という訳にはいきませんので、人間のチェックは不可欠ですが、少なくとも、大学生アルバイトよりは正解に近い回答はできるのではないでしょうか。
また、数学・化学・経済学などの分野では大幅に精度が向上しているということですので、大学入試模範解答作成のバイトもお願いできそうです。

◯会社経理事務

ちょっとびっくりしますが、会社の経理実務もこなせるようです。
Open AI社のデモ動画で紹介されているユースケースですが、経理処理のような「ルールが明確で複雑な処理」は、確かにAI向きと言えます。
例えば、「領収書をスマホで撮影して登録すれば、あとはChat GPTに任せて経理処理や経費清算などをやってくれる」そんなサービスが期待できます。

◯プログラミング補助

プログラミングもChat GPTの得意とするところです。もしChat GPTがGoogleでコーディング職の試験を受けた場合、年収2,400万円で採用される実力を持っていると報告されています。
ただし、明確に定義づけられた部分的なコーディングには強いかも知れませんが、「現実の課題を分析し、必要な機能を設計した上で、UIなどの仕様に落とし込む」ことはまだ難しいでしょう。

また、Chat GPTの知識は2021年時点で止まっています。それ以降に知られるようになった新しい手法などは使うことができません。あくまで、システムエンジニアやプログラマーが補助的に活用する範囲で、非常に優秀ということになります。

ここでは、他の記事でよく紹介されている要約などの利用例については除外して、少し目新しい視点でのユースケースを挙げてみました。まだまだ、色々な活用方法がありそうです。*注2

契約書の作成からネット記事やSEOで有効な見出しの作成、マーケットリサーチ、FAQの作成、マニュアル作成などなど。
日々、膨大な時間と労力をかけて人力でやっている文章作成への活用が、一番ニーズが高いのかも知れません。*注3

GPT-4でも「まだできないこと、気をつけるべきこと」

もちろん、進化したGPT-4であっても、まだまだ完全ではありません。100%の信頼を置くのは危険ですし、どんなケースであっても最終的には人間による確認・チェックは必要でしょう。

例えば、GPT-4は「ユーモア」に関する部分でも、かなり進歩が感じられる結果を出力してくれます。
最新のiPhoneに旧式のプラグが刺さっている画像を見せて、「この画像は何がおかしいか？」というテストには、かなり正確な回答を出力しています。

まず画像を解析し、新型のiPhoneと旧式のプラグを判別。その2つが「常識的にマッチしないもの」であると判断し、理由をつけて文章で回答します。実に理路整然と「ユーモラス」な画像の説明をしてくれます。

しかし、これは漫才やコントのネタを理論的に分析しているだけで、本当の「面白さ」を感覚的に理解しているのとは大きく異なります。
そのため、「ジョークを作りなさい」といった種類の要求には、大して面白くもない文章で応えてきます。

創造性・独自性・感情に関するものや、センスが問われるものなどを期待してはいけません。得意とする分野は、事実に基づくことであり、論理的に分析・解釈できることです。
とは言え、まだまだ100%の信頼を置く訳にはいきませんので、十分用心して利用することが重要です。

また、Safety機能も強化されていますので、犯罪に関することやモラルに違反することなどに利用することはできません。これは「できる・できない」ではなく、「やるべきではない」ことではありますが。*注4

【まとめ】
今回は、私たちの生活やビジネスシーンを大きく変える可能性があるChat GPTについて、まとめてみました。早くも面白い使い方をして、遊んでる人がネット上に多くみられます。
どのような分野であっても、最初は「面白がって、色々使ってみる」ことが意外に重要であり、そこから新たな価値が生み出されることも多いのが事実です。
まだ触ったことのない方は、ぜひこの機会に一度試してみてはいかがでしょうか。

大手ゼネコンBIM活用事例と建設業界のDXについてまとめたホワイトペーパー配布中！

❶大手ゼネコンのBIM活用事例
❷BIMを活かすためのツール紹介
❸DXレポートについて
❹建設業界におけるDX

DOWNLOAD

▼キャパの公式Twitter・FacebookではITに関する情報を随時更新しています！

■参考文献
注1
GITIFUL　「「GPT-4」がもたらすChatGPTのさらなる進化。「GPT-3.5」との比較で整理」
https://digiful.irep.co.jp/blog/111641464440

OTONA Life　「【ChatGPT】GPT-4とは？GPT-3.5との性能差や回答の質の違い、料金、登録方法」
https://otona-life.com/2023/05/12/171947/

注2
Gigazine　「ChatGPTがGoogleのコーディング職の試験を受けると年収2400万円のレベル3エンジニアとして合格する」
https://gigazine.net/news/20230206-chatgpt-passed-google-coding-interview/

PigData　「GPT-4とは?GPT-3.5との違いを解説！実際の活用事例も紹介します」
https://pig-data.jp/blog_news/blog/scraping-crawling/ai_gpt4/

Yahoo! Japan News　（AMP）　「GPT－4とGPT－3.5（現行ChatGPT）の違い。数学、法律、コーディング能力が向上」
https://news.yahoo.co.jp/articles/16a5e6a4be90fde46917c2913afecd528d745a89?page=1

注3
Alsmiley　「GPT-4とは？特徴やできること・GPT-3.5との違いを事例で徹底比較！」
https://aismiley.co.jp/ai_news/what-is-gpt-4/

注4
Zenn　「GPT-4とは？【概要と使い方 / GPT-3.5と比較 / ChatGPTでの使用方法】」
https://zenn.dev/umi_mori/articles/what-is-gpt-4

2023.08.10

投稿者: chiebo

GPT-3.5とGPT-4の違い

GPT-4でできる「こんなこと、あんなこと」

GPT-4でも「まだできないこと、気をつけるべきこと」

大手ゼネコンBIM活用事例と 建設業界のDXについてまとめた ホワイトペーパー配布中！

この記事を読んだ人は、こちらの記事も読んでいます。

【週間】建設/製造業界の人気記事

最新の人気記事

歴代の人気記事

カテゴリ一覧

大手ゼネコンBIM活用事例と建設業界のDXについてまとめたホワイトペーパー配布中！