• Нямате артикули в количката.

Дали OpenAI и Google са използвали транскрипции на видеоклипове от YouTube, за да обучават моделите си?

Според The New York Times компаниите може да са нарушили авторските права на създателите на YouTube.

Според The New York Times OpenAI и Google са обучавали своите модели за изкуствен интелект на базата на текст, преписан от видеоклипове в YouTube, с което потенциално са нарушили авторските права на създателите. Докладът, в който се описва докъде са стигнали OpenAI, Google и Meta, за да увеличат максимално количеството данни, с които могат да захранват своите изкуствени интелекти, се позовава на множество хора, запознати с практиките на компаниите.

Той се появява само няколко дни след като главният изпълнителен директор на YouTube Нийл Мохан заяви в интервю за Bloomberg Originals, че предполагаемото използване от OpenAI на видеоклипове от YouTube за обучение на новия генератор на текст във видео, Sora, би било в разрез с политиките на платформата.

Според NYT OpenAI е използвала своя инструмент за разпознаване на реч Whisper, за да транскрибира повече от един милион часа видеоклипове в YouTube, които след това са били използвани за обучение на GPT-4.

По-рано The Information съобщи, че OpenAI е използвала видеоклипове от YouTube и подкастове за обучение на двете системи за изкуствен интелект. Съобщава се, че президентът на OpenAI Грег Брокман е бил сред хората в този екип. Според правилата на Google „неоторизираното събиране или изтегляне на съдържание от YouTube“ не е разрешено, заяви Мат Брайънт, говорител на Google, пред NYT, като каза също, че компанията не знае за подобно използване от страна на OpenAI.

В доклада обаче се твърди, че в Google е имало хора, които са знаели, но не са предприели действия срещу OpenAI, тъй като Google е използвала видеоклипове от YouTube за обучение на собствените си модели за изкуствен интелект. Google заяви пред NYT, че прави това само с видеоклипове от създатели, които са се съгласили с това. Engadget е потърсил Google и OpenAI за коментар.

В доклада на NYT се твърди също, че през юни 2023 г. Google е помолила екипа си да промени политиката за поверителност, за да обхване по-широко използването на публично достъпно съдържание, включително Google Docs и Google Sheets, за обучение на моделите и продуктите с изкуствен интелект. Промените, за които Google твърди, че са направени за по-голяма яснота, са били публикувани през юли.

Брайънт заяви пред NYT, че този тип данни се използват само с разрешението на потребителите, които са избрали да участват в тестовете на експерименталните функции на Google, и че компанията „не е започнала да обучава допълнителни типове данни въз основа на тази езикова промяна“. С промяната е добавен Bard като пример за това, за какво могат да се използват тези данни.

Издигнете канала си на следващото ниво с нашите YouTube курсове и обучения, специално създадени за съвременния YouTube маркетинг. С абонамент за 6 или 12 месеца ще получите пълен достъп до всички обучения. Ако вече сте част от нашата общност, разгледайте новите курсове и се възползвайте от нови възможности.



Facebook Група за потребителите ни

Ако вече имате регистрация в сайта ни, можете да се присъедините към затворената ни Facebook група. Тук ежедневно обменяме идеи и обсъждаме стратегии за развитие на видео канали, създаване на съдържание и оптимизация на видео. Групата предоставя пространство за споделяне на опит, съвети и най-добри практики, насочени към постигане на успех.

8 декември , 2024