Використання YouTube для тренування ШІ: нові виклики для авторських прав
Компанія Google активно інтегрує матеріали з величезної бібліотеки YouTube для навчання своїх моделей штучного інтелекту, таких як Gemini і новий генератор відео та аудіо Veo 3. Про це повідомляє CNBC з посиланням на свої джерела.
Один із джерел видання розповів, що для навчання використовується добірка з каталогу в 20 мільярдів відео. Google підтвердила цю інформацію, однак зазначила, що йдеться лише про частину контенту в межах угод з авторами та медіа-компаніями.
Представник YouTube пояснив, що компанія завжди використовувала свій контент для покращення своїх сервісів — поява генеративного ШІ не змінила цю практику. "Ми усвідомлюємо важливість гарантій, тому створили надійні механізми захисту для авторів", — зазначили у компанії.
Проте експерти висловлюють занепокоєння щодо наслідків для авторських прав. Вони вважають, що використання відео без відома авторів для тренування ШІ може призвести до кризи в сфері інтелектуальної власності. Хоча YouTube заявляє, що раніше повідомляв про це, більшість авторів не знали, що їхній контент використовується для навчання.
Google не повідомляє, скільки відео використовувалися для тренування моделей. Але навіть якщо йдеться про 1% бібліотеки, це більше ніж 2,3 мільярда хвилин контенту — у 40 разів більше ніж у конкурентів.
Завантажуючи відео, автори надають YouTube широкий дозвіл на використання контенту. Водночас, у них немає можливості відмовитися від використання своїх відео для навчання моделей Google.
Представники компаній, що захищають цифрові права, вважають, що багаторічна праця авторів використовується для розробки ШІ без належної винагороди або навіть сповіщення. Наприклад, компанія Vermillio створила сервіс Trace ID, що визначає схожість ШІ-відео з оригінальним контентом. У деяких випадках відповідність перевищувала 90%.
Деякі автори не проти використання їхнього контенту для навчання, розглядаючи нові інструменти як можливість для експериментів. Але більшість вважають, що ситуація є непрозорою та потребує чіткіших правил.
YouTube навіть уклав угоду з Creative Artists Agency для розробки системи управління ШІ-контентом, що імітує відомих людей. Проте механізми видалення або відстеження схожого контенту все ще потребують вдосконалення.
Тим часом у США вже звучать заклики надати авторам юридичний захист, що дозволить їм контролювати використання їхньої творчості в світі генеративного ШІ.
Нагадаємо, нещодавно компанія Google змінила внутрішні правила модерації контенту на YouTube — тепер відео, що частково порушують правила, можуть залишатися онлайн, якщо їх вважають суспільно важливими.



