
Според The New York Times OpenAI и Google са обучавали своите модели за изкуствен интелект на базата на текст, преписан от видеоклипове в YouTube, с което потенциално са нарушили авторските права на създателите. Докладът, в който се описва докъде са стигнали OpenAI, Google и Meta, за да увеличат максимално количеството данни, с които могат да захранват своите изкуствени интелекти, се позовава на множество хора, запознати с практиките на компаниите.
Той се появява само няколко дни след като главният изпълнителен директор на YouTube Нийл Мохан заяви в интервю за Bloomberg Originals, че предполагаемото използване от OpenAI на видеоклипове от YouTube за обучение на новия генератор на текст във видео, Sora, би било в разрез с политиките на платформата.
Според NYT OpenAI е използвала своя инструмент за разпознаване на реч Whisper, за да транскрибира повече от един милион часа видеоклипове в YouTube, които след това са били използвани за обучение на GPT-4.
По-рано The Information съобщи, че OpenAI е използвала видеоклипове от YouTube и подкастове за обучение на двете системи за изкуствен интелект. Съобщава се, че президентът на OpenAI Грег Брокман е бил сред хората в този екип. Според правилата на Google „неоторизираното събиране или изтегляне на съдържание от YouTube“ не е разрешено, заяви Мат Брайънт, говорител на Google, пред NYT, като каза също, че компанията не знае за подобно използване от страна на OpenAI.
В доклада обаче се твърди, че в Google е имало хора, които са знаели, но не са предприели действия срещу OpenAI, тъй като Google е използвала видеоклипове от YouTube за обучение на собствените си модели за изкуствен интелект. Google заяви пред NYT, че прави това само с видеоклипове от създатели, които са се съгласили с това. Engadget е потърсил Google и OpenAI за коментар.
В доклада на NYT се твърди също, че през юни 2023 г. Google е помолила екипа си да промени политиката за поверителност, за да обхване по-широко използването на публично достъпно съдържание, включително Google Docs и Google Sheets, за обучение на моделите и продуктите с изкуствен интелект. Промените, за които Google твърди, че са направени за по-голяма яснота, са били публикувани през юли.
Брайънт заяви пред NYT, че този тип данни се използват само с разрешението на потребителите, които са избрали да участват в тестовете на експерименталните функции на Google, и че компанията „не е започнала да обучава допълнителни типове данни въз основа на тази езикова промяна“. С промяната е добавен Bard като пример за това, за какво могат да се използват тези данни.
Издигнете канала си на следващото ниво с нашите YouTube курсове и обучения, специално създадени за съвременния YouTube маркетинг. С абонамент за 6 или 12 месеца ще получите пълен достъп до всички обучения. Ако вече сте част от нашата общност, разгледайте новите курсове и се възползвайте от нови възможности.
Facebook Група за потребителите ни
Ако вече имате регистрация в сайта ни, можете да се присъедините към затворената ни Facebook група. Тук ежедневно обменяме идеи и обсъждаме стратегии за развитие на видео канали, създаване на съдържание и оптимизация на видео. Групата предоставя пространство за споделяне на опит, съвети и най-добри практики, насочени към постигане на успех.