AppleはYouTubeの動画文字起こしデータをAI訓練に利用したとされる報告を受けて、OpenELMの使用および計画について説明しました。
EleutherAIがYouTubeの字幕データセットを使用したことはYouTubeのデータ使用方針に反する可能性があり、AppleはTechRadarに対し、YouTubeデータの使用に関しては直接言及せず、クリエイターや出版社の権利を尊重する姿勢を強調しました。
また、AppleはWWDC 2024で発表したiOS 18に搭載されるApple Intelligenceの訓練に使用されるデータについて、出版社からのライセンスデータ、ストックイメージ、および一部の公に利用可能なウェブデータを使用すると述べました。
Appleの研究モデルであるOpenELMは、言語モデルの学習ツールとして利用され、Pileデータで訓練されたことが確認されています。
AppleはOpenELMが研究目的であり、Apple製品のAI機能には使用されていないことを明らかにし、今後OpenELMの新バージョンを構築する計画はないと述べました。
YouTubeのクリエイターたちの一部は安心できるかもしれませんが、EleutherAIがYouTubeやクリエイターの許可なくデータをスクレイピングし、Appleを含む他の企業に提供した事実には変わりありません。