目次
今年もGoogle I/Oがカリフォルニア州マウンテンビューのステージで行われました。
ピチャイ氏をはじめとするグーグル首脳陣が、AIを搭載した内容を発表しました。
Google Geminiやその様々なアプリケーション、Androidに搭載される予定のものなど、フォーカスはほぼすべてソフトウェアとAIに当てられています。
これまでのGoogle I/O基調講演とは異なり、今回はハードウェアの発表やお披露目は一切なく、驚くようなことはありませんでした。
事前予想では、Pixel 9シリーズや、一部ではPixel 9 Pro Foldと呼ばれているPixel Fold 2のお披露目があるかもしれないと考えられていましたが、いずれも実現しませんでした。
Project Astra
Googleは、未来のAIアシスタントであるProject Astraを発表しました。
これは、スマートフォンで撮影したビデオと音声認識を使って、質問に対して文脈に沿った回答を提供するものです。
デモでは、誰かがProject Astraを使いコーディングの問題を解決し、同時に、以前にかけたメガネをどこに忘れてきたかを追跡しています。
Google Workspace
Geminiは、Gmailのような人気のあるGoogleサービスに展開され、長いメールチェーンの一部であるメールを要約することが出来るようになります。
Geminiがあなたの電子メールの会話を分析した後、より文脈に沿った返信を提供することを可能にするスマート返信機能もあります。
アンドロイドのAI対応
Googleは、Android 15に関する機能を直接披露したり言及したりはしませんでしたが、より多くのAI機能がAndroidに搭載されることを明らかにしています。
例えば、SearchへのCircleの広範な展開があげられます。
また、TalkBack for Androidと呼ばれるAI機能は、目の不自由な人のために写真の説明をアナウンスするアクセシビリティツールのようなものです。
Google Search
AIオーバービューによる迅速な回答、旅行日程表の作成、ビデオを使って問題を解決する機能など、Geminiの新機能により、Googleでの検索が飛躍的に向上する事を発表していました。
Google Veo
VeoはGoogleの最新のジェネレーティブAIモデルで、1080pのビデオを作成することができます。
Googleによれば、Veoは1分以上のビデオを作成することができます。
タイムラプスや「風景の空撮」などの映画的な用語を理解することができ、この技術はドナルド・グローバーとのコラボレーションビデオで一部披露されました。
Veoは、VideoFX内の選択されたユーザーに利用可能で、興味がある場合はウェイトリストがあります。
Imagen 3
更新されたImagen 3は、テキストプロンプトに基づいて画像を生成することができます。
「自然言語、プロンプトの背後にある意図、そして長いプロンプトからの小さな詳細をよりよく理解する」ようにアップグレードされました。
Googleは、これがこれまでで最高のテキストレンダリングモデルであると主張しています。これが事実であれば、画像内で奇妙なスペルミスや単語風の画像を見る日々は終わりです。
Imagen 3は、ImageFXのプレビューとして一部のクリエーターに利用可能です。
興味がある方は、Googleにウェイトリストがあります。Googleは具体的な時期を明らかにしていませんが、Imagen 3は近いうちにVertex AIで利用可能になるとのことです。
Music AI Sandbox
Music AI Sandboxと呼ばれるAIツールのスイートが登場すると簡単に触れています。
このツールは、ユーザーが新しい楽器のセクションを作成し、音を変換することを可能にすることを目指しています。
Wyclef Jean、Marc Rebillet、Justin Tranterとのパートナーシップを述べた以外、GoogleはAIツールの詳細については詳述していません。