OpenAIは今週初めに、ほとんどのユーザーがGPT-4oの高度な音声機能を利用できるのは秋まで待つ必要があると発表しましたが、一部のラッキーな人々は次世代音声アシスタントのプレビューを受け取ったようです。
RedditユーザーのRozziTheCreatorはその一人で、新しいGPT-4oの声が雷や足音などの効果音とともにホラー話を語る録音を共有しました。
このクリップはAIライターのSambhav GuptaによってXで紹介され、広く注目されました。
OpenAIは声明で、一部のユーザーに誤ってモデルへのアクセスを与えたが、現在は修正されたと述べています。
リークされたビデオの内容
これまでに公開されたGPT-4oの音声はすべてOpenAIの管理下で行われており、特定のユースケースに限定されていました。
しかし、RozziTheCreatorによる新しいビデオは、これまでに聞いたことのない効果音機能を含む、より自然な形での能力を示しています。
RozziTheCreatorによると、「突然現れた。それ以外は同じで、唯一の違いは声だった」とのことです。
発見は夜遅く、チャットボットに質問しようとしたときに起こり、「数分間だけ続いたが、とてもバグが多かった」とのことです。
録音された部分では、GPT-4oがカジュアルに物語を語り、効果音でバックアップされているのが聞こえます。
ロールアウトの問題
OpenAIは新機能の展開をゆっくりと進めています。
最初のPlusユーザーは今月中にGPT-4oの高度な音声機能を利用できる予定でしたが、セキュリティ問題やハードウェアインフラの懸念から延期されました。
OpenAIのスポークスパーソンは、「機能をテストする際に、少数のChatGPTユーザーに誤って招待を送った」と説明しました。
来月には最初のPlusユーザーがアクセスできるようになる予定ですが、大多数のユーザーにとってはもう少し時間がかかります。
これにより、GPT-4oの完全な能力に対する期待が高まり、遅延に対する苛立ちも増しています。