МЕНЛО-ПАРК, Калифорния (Рейтер) — Компания Meta Platforms (META.O) использовала общедоступные публикации в Facebook и Instagram для обучения частей своего нового виртуального помощника Meta AI, но исключила частные публикации, которыми делились только с семьей и друзьями, чтобы Будьте уважительны.Компания сообщила Reuters в интервью, что конфиденциальность потребителей.
Meta также не использовала приватные чаты в своих службах обмена сообщениями в качестве обучающих данных для модели и предприняла шаги по фильтрации личных данных из общедоступных наборов данных, используемых для обучения, сказал Ник Клегг, руководитель отдела глобальных связей Meta, выступая в кулуарах ежегодного собрания компании. Подключить конференцию. На этой неделе.
«Мы пытались исключить наборы данных с большим преобладанием личной информации», — сказал Клегг, добавив, что «подавляющее большинство» данных, которые Meta использует для обучения, общедоступны.
Он привел LinkedIn в качестве примера веб-сайта, контент которого Meta намеренно предпочла не использовать из соображений конфиденциальности.
Комментарии Клегга прозвучали в связи с тем, что технологические компании, в том числе Meta, OpenAI и Google Alphabet, подверглись критике за использование информации, полученной из Интернета, без разрешения для обучения своих моделей искусственного интеллекта, которые поглощают огромные объемы данных для обобщения информации и создания изображений. .
Компании задумываются о том, как обращаться с проприетарными материалами или материалами, защищенными авторским правом, которые выгружаются в процессе, и о том, что их системы искусственного интеллекта могут воспроизводиться, поскольку они сталкиваются с судебными исками со стороны авторов, которые обвиняют их в нарушении авторских прав.
Meta AI стал самым значимым продуктом среди первых инструментов искусственного интеллекта, ориентированных на потребителя, представленных генеральным директором Марком Цукербергом в среду на ежегодной конференции продуктов Connect компании Meta. В этом году на мероприятии доминировали разговоры об искусственном интеллекте, в отличие от предыдущих конференций, посвященных дополненной и виртуальной реальности.
Мета сообщил, что помощник использует специальную модель, основанную на мощной модели большого языка Llama 2, которую компания запустила для общего использования в бизнесе в июле, а также новую модель под названием Emu, которая генерирует изображения в ответ на текстовые подсказки.
Продукт сможет генерировать текст, аудио и изображения и будет иметь доступ к информации в режиме реального времени благодаря партнерству с поисковой системой Microsoft Bing.
По словам Клегга, общедоступные сообщения в Facebook и Instagram, которые использовались для обучения Meta AI, включали текст и изображения.
Представитель Meta сообщил Reuters, что эти посты использовались для обучения Emu элементам генерации изображений продукта, в то время как функции чата были основаны на Llama 2 с добавлением некоторых общедоступных и аннотированных наборов данных.
По словам представителя, взаимодействие с Meta AI также может быть использовано для улучшения функций в будущем.
По словам Клегга, Meta наложила ограничения безопасности на контент, который может создавать инструмент Meta AI, например, запрет на создание реалистичных изображений общественных деятелей.
Что касается материалов, защищенных авторским правом, Клегг заявил, что он ожидает «изрядного количества судебных разбирательств» по вопросу о том, «подпадает ли творческий контент под действие существующей доктрины добросовестного использования», которая разрешает ограниченное использование защищенных произведений для таких целей, как комментирование и исследования. И пародии.
«Мы считаем, что это так, но я сильно сомневаюсь, что это отразится на судебных исках», — сказал Клегг.
Некоторые компании с помощью инструментов создания изображений упрощают воспроизведение известных персонажей, таких как Микки Маус, в то время как другие платят за материалы или намеренно избегают включения их в обучающие данные.
Например, этим летом OpenAI подписала шестилетний контракт с поставщиком контента Shutterstock на использование библиотек фотографий, видео и музыки компании для обучения.
На вопрос, предприняла ли Meta какие-либо подобные шаги, чтобы избежать воспроизведения изображений, защищенных авторским правом, представитель Meta указал на новые условия обслуживания, которые запрещают пользователям создавать контент, нарушающий конфиденциальность и права интеллектуальной собственности.
(Репортаж Кэти Пол в Менло-Парке, Калифорния; подготовка Мухаммеда к арабскому бюллетеню) Редактирование Кеннета Ли, Мэтью Льюиса и Линкольна Фиста
Наши стандарты: Принципы доверия Thomson Reuters.
More Stories
Nintendo запускает музыкальное приложение с темами из Марио и Зельды и, что более важно, канал Wii Shop.
Загрузки Call of Duty: Black Ops 6 позволяют максимально эффективно использовать Интернет
Интересные факты M4 Mac mini: изменения в дизайне, поддержка внешнего дисплея и многое другое