Федеральный судья США встал на сторону Meta* в споре об авторских правах при обучении ИИ

Wait 5 sec.

Федеральный судья Винс Чхабрия из окружного суда Сан-Франциско вынес решение в пользу компании Meta* в деле об обвинении в нарушении авторских прав. Авторы обвиняли технологического гиганта в использовании их произведений для обучения модели Llama без разрешения. Судья постановил, что использование Meta* литературных произведений для обучения своей модели является достаточно «преобразующим», чтобы подпадать под действие принципа «добросовестного использования» в соответствии с законодательством об авторских правах США. Это уже вторая подобная победа компаний, работающих в сфере ИИ, на этой неделе. Однако, решение суда содержит важное уточнение. Судья указал, что авторы могли бы выиграть дело, если бы правильно аргументировали, что обучение мощных генеративных ИИ на основе материалов, защищенных авторским правом, создаёт инструмент, позволяющий большому количеству пользователей конкурировать с авторами на литературном рынке. По словам судьи, независимо от того, насколько преобразующим является обучение генеративного ИИ, трудно представить, что использование книг, защищённых авторским правом, для разработки инструмента, приносящего миллиарды или триллионы долларов, и одновременно позволяющего создавать потенциально бесконечный поток конкурирующих работ, может считаться добросовестным использованием. Это может серьёзно навредить рынку книг. Иллюстрация: Dalle Для обучения больших языковых моделей, лежащих в основе генеративного ИИ, требуются огромные объёмы данных. В связи с этим музыканты, писатели, художники и новостные издания подали в суд на различные компании, занимающиеся разработкой ИИ, которые использовали их данные без разрешения или оплаты. Компании обычно защищают свою практику, ссылаясь на добросовестное использование, утверждая, что обучение ИИ на больших наборах данных радикально преобразует исходный контент и необходимо для инноваций. В рассматриваемом деле группа авторов подала в суд на Meta за скачивание пиратских копий их работ и использование их для обучения открытого генеративного ИИ Llama. Среди книг, упомянутых в иске, были комическая автобиография Сары Сильверман The Bedwetter и получивший Пулитцеровскую премию роман Хуно Диаса The Brief Wondrous Life of Oscar Wao. В своём решении судья подчеркнул, что это решение не означает, что использование материалов, защищённых авторским правом, для обучения своих языковых моделей является законным. Это решение лишь констатирует, что истцы использовали неправильные аргументы и не смогли подкрепить их надлежащими доказательствами. Подобное решение было принято и в другом деле - в понедельник другой федеральный судья в Сан-Франциско встал на сторону компании Anthropic, которая также обучала свои модели ИИ на книгах, защищённых авторским правом, без разрешения авторов. Судья Уильям Олсап постановил, что обучение моделей Claude с помощью купленных или пиратских книг разрешено в соответствии с доктриной «добросовестного использования» в Законе США об авторском праве. Однако он отклонил просьбу Anthropic о предоставлении всеобъемлющей защиты, постановив, что практика компании по скачиванию миллионов пиратских книг для создания постоянной цифровой библиотеки не оправдывается защитой добросовестного использования. * Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена