
マイクロソフトのAI部門は木曜日、自社開発の初のAIモデル「MAI-Voice-1 AI」と「MAI-1-preview」を発表しました。
MAI-Voice-1は、1GPUでわずか1秒以内に1分間の音声を生成できる音声モデルです。
一方、MAI-1-previewは「Copilot内での将来の提供内容の一端を示すモデル」と説明されています。
MAI-Voice-1はすでに、AIホストが当日のニュースを読み上げる「Copilot Daily」や、ポッドキャスト形式で話題を解説する機能に活用されています。
ユーザーはCopilot LabsでMAI-Voice-1を試すことができ、生成する音声の内容や声質、話し方のスタイルを変更可能です。
MAI-1-previewは約15,000台のNvidia H100 GPUで訓練され、指示に従って日常の質問に有用な回答を返すAIモデルとして設計されています。
マイクロソフトのAI責任者ムスタファ・スレイマン氏は、社内モデルは企業向けよりも消費者向けに最適化されていると語っており、「私たちは消費者向けに非常によく機能するモデルを作ることに注力しています」と述べています。
MAI-1-previewは、現在OpenAIの大規模言語モデルに依存しているCopilot AIアシスタントの一部のテキスト用途に順次導入される予定です。
また、AIベンチマークプラットフォーム「LMArena」でも公開テストが始まっています。
マイクロソフトAIは今後、さらなる技術進歩を目指すとともに、異なるユーザーの意図や用途に応じた専門モデルを組み合わせることで大きな価値を生み出すとしています。