
ChatGPTの新バージョンであるGPT-4.5の登場により、他のAIモデルとの比較が自然と注目を集めています。
GPT-4.5とGPT-4oの比較では明確な優劣がつかなかったため、今回はGoogleの最新AIモデル「Gemini Flash 2.0」との比較を行いました。
GPT-4.5は感情理解の向上や誤情報(ハルシネーション)の減少を強調しています。
一方、Gemini Flash 2.0は、テキストだけでなく画像・音声・動画にも対応する高度なマルチモーダルAIです。この2つを試すために、一般的な用途を想定した5つのテストを実施しました。
1. 週末旅行の計画
最初のテストは、旅行計画の提案です。
「山地への週末旅行を計画し、ハイキングのおすすめコース、食事、宿泊情報を教えてください」と依頼しました。
GPT-4.5は、難易度別のハイキングコース、近隣のレストラン、おすすめの宿泊施設を詳しく提案し、アクセス方法まで補足しました。
一方、Geminiはハイキングと食事のおすすめは良かったものの、宿泊に関しては周辺の町名を挙げるのみで、具体性に欠けていました。
2. 翻訳テスト
次に、翻訳能力を比較しました。
「英語1000字程度の文章をフランス語・スペイン語・日本語に訳してください」と依頼します。
両AIとも正確な翻訳を提示し、明確な違いは見られませんでした。
ただし、GPT-4.5は補足情報としてリンクを提供するなど、若干の付加価値を加えていました。
3. ユーモアのセンス
次は、ジョークの生成能力を試しました。
「人工知能に関するジョークを教えてください」と依頼。
GPT-4.5:「なぜAIは美術学校に通ったの? 自分の結論を"描く"方法を学ぶためさ!」
Gemini:「なぜAIはチャットボットの恋人と別れたの? 彼女がいつも台本通りの返事しかしなかったからさ!」
どちらも軽いダジャレでしたが、面白さのレベルはほぼ同じでした。
4. 天気予報の精度
最後に、ニューヨーク州ナイアックの天気を尋ねました。
Geminiは現在の天気のみを提示したのに対し、GPT-4.5は1時間ごとの詳細な天気予報に加え、視覚的なアイコンを用いた表示を行いました。
この点は明確にGPT-4.5のほうが情報量が豊富でした。
5. 要約や作業依頼
文章の要約や、整形作業の依頼など、簡単な作業依頼をさせるとGPT-4.5の方がユーザーの期待に応えた回答を出力しやすいです。
例えば、要約であれば元記事のセンテンスを出来るだけ維持しようとしたり、入力された情報を派手に変更せずに対応しようとします。
指示次第でより柔軟に出力させることも可能です。
結論
今回のテストに限らず、情報精度でややGPT-4.5に軍配が上がります。
さらに、細かい作業依頼をお願いすると依然としてややChatGPTが優位です。
現状Geminiは感情理解やハルシネーションに課題があるため改善が期待されます。
GPT-4.5は詳細な情報提供に優れ、Geminiはマルチモーダル対応という強みを持っています。
最終的には、ユーザーの好みや使い方用途によって使い分けるのが最適と言える所まで来ています。