コンテンツ無断使用で訴えられたOpenAI、NYTが意図的にプロンプトを操作して学習データの逆流に見せたと反論 55
意図 部門より
訴状で NYT は Microsoft と OpenAI が LLM に学習させるためにコンテンツを無断使用したほか、従来のサーチエンジンによるものより大幅に長く、詳細な記事サマリーを許可なく Bing に掲載しているにもかかわらず、フェアユースだと主張してライセンス契約に応じなかったと主張している。
しかし、OpenAI は NYT との提携に向けた話し合いが進んでいるつもりでいたといい、提訴に驚き、落胆したとのこと。NYT は具体例を示さずに学習コンテンツから生成コンテンツへの逆流がみられると言及していたが、このようなコンテンツは古く、複数のサードパーティーサイトに転載されたもののようだと OpenAI は指摘する。
また、NYT がプロンプトに記事の長い引用を含めるなど、逆流させるために意図的なプロンプト操作を行ったのではないかとも指摘している。それでも OpenAI のモデルは NYT が示唆するようには動作しない。そのため、NYT がモデルに逆流させるよう指示したか、多数の試行結果から都合のいいものを抜き出したとみられるとのことだ。