ИИ тренируют с помощью книг
Иллюстрация создана с помощью ИИ.

Nvidia обвинили в обучении ИИ на пиратских книгах

Новость
Семён БеляевСемён Беляев27.01.2026

Вероятно, в их числе были и фанфики.

По данным TorrentFreak, Nvidia натренировала языковую модель NeMo на одном из крупнейших в мире теневых архивов — Anna’s Archive, содержащем книги общим объёмом около 500 терабайт. Многие из них были получены путём нелегального копирования.

В 2024 году против компании был подан иск тремя авторами, уверенными, что Nvidia использовала их произведения для обучения ИИ. Истцами выступили писатели Брайан Кин (цикл «Леви Штольцфус»), Абди Наземян («Like a Love Story») и Стюарт О’Нэн («Прошлой ночью у лобстера»).

На днях писатели передали в суд обновлённую жалобу, подкреплённую перепиской между администрацией репозитория Anna’s Archive и представителями Nvidia. Из неё следует, что репозиторий запрашивал более 10 000 долларов за экспресс-доступ к данным, а Nvidia интересовалась деталями такого доступа. Администрация уточняла, получили ли представители компании внутреннее разрешение на использование данных, поскольку многие из них были получены нелегальным путём. Согласно переписке, такое разрешение было получено в течение недели, но факта получения оплаты представителями архива пока нет.

Anna’s Archive представляет собой поисковую систему по теневым библиотекам, объединяющим другие ресурсы, включая LibGen, Sci-Hub и Z-Library. Проект появился после того, как один из подобных ресурсов был заблокирован по решению суда. Незадолго до обновления иска Anna’s Archive также лишился собственных доменов после судебного решения и в настоящее время недоступен.

Основанием для иска стало распространение датасета под названием Books3, включающего более 196 000 книг. Этот набор данных содержал все книги с пиратского сайта Bibliotik и использовался для обучения многих популярных ИИ, включая ChatGPT и LLaMA. Nvidia ранее признавала его использование: первоначальная версия NeMo была заблокирована, однако позднее компания выпустила обновлённую версию, очищенную от материалов, защищённых авторским правом.

Писатели требуют компенсацию за неправомерное использование работ в коммерческой деятельности. К иску могут присоединиться сотни других писателей, которые считают, что их работы были использованы для обучения ИИ.

Семён Беляев
Семён Беляев
Автор статьи
Комментарии
Комментарии (0)

Пока нет комментариев. Будьте первым!