26 октября, 2024

Orsk.today

Будьте в курсе последних событий в России благодаря новостям Орска, эксклюзивным видеоматериалам, фотографиям и обновленным картам.

Ваш онлайн-контент — это «бесплатный» материал для учебных модулей • История

Ваш онлайн-контент — это «бесплатный» материал для учебных модулей • История

Мустафа Солиман, генеральный директор Microsoft AI, заявил на этой неделе, что компании, занимающиеся машинным обучением, могут извлекать большую часть контента, размещенного в Интернете, и использовать его для обучения нейронных сетей, поскольку они, по сути, являются «свободным программным обеспечением».

Вскоре после этого Центр журналистских расследований Подайте иск против OpenAI Ее крупнейший инвестор, Microsoft, «за использование контента некоммерческой новостной организации без разрешения или предоставления компенсации».

Это следует по стопам восьми газет. Подали иск против OpenAI и Microsoft о предполагаемом незаконном присвоении контента в апреле, как это сделала The New York Times четырьмя месяцами ранее.

А еще есть два блестящих автора Подали иск против OpenAI и Microsoft В январе они заявили, что без разрешения обучали модели ИИ на произведениях авторов. Также в 2022 году несколько анонимных разработчиков подали иск против OpenAI и GitHub на основании обвинений в том, что организации использовали публично опубликованный код для обучения генеративных моделей в нарушение условий их лицензии на программное обеспечение.

Спросили в Интервью В беседе с корреспондентом CNBC Эндрю Россом Соркиным на Фестивале идей в Аспене о том, действительно ли компании, занимающиеся искусственным интеллектом, украли мировую интеллектуальную собственность, Соломон признал противоречие и попытался провести различие между контентом, который люди размещают в Интернете, и контентом, поддерживаемым корпоративными правообладателями.

«Я думаю, что с точки зрения контента, который уже существует в открытой сети, общественным договором на этот контент с 1990-х годов является добросовестное использование», — сказал он. «Любой мог скопировать его, воссоздать, воспроизвести с его помощью. Это было свободное программное обеспечение, если вы этого хотели. Таково было понимание».

Соломон допускал еще одну категорию контента — материалы, публикуемые компаниями, у которых есть юристы.

READ  Тизер First Control 2 может быть раскрыт благодаря дополнительной кат-сцене в новом DLC Alan Wake 2

«Есть отдельная категория, в которой веб-сайт, издатель или новостная организация прямо заявили: «Не удаляйте и не сканируйте меня по какой-либо причине, кроме как для того, чтобы проиндексировать меня, чтобы другие могли найти этот контент», — пояснил он. «Но это серая зона. Я думаю, что это пройдет через суд».

Это мягко говоря. Хотя кажется очевидным, что заявления Солимана оскорбят создателей контента, он не совсем не прав — неясно, где лежат правовые нормы в отношении обучения моделей ИИ и вывода моделей.

Большинство людей, публикующих контент в Интернете от личного имени, тем или иным образом нарушили свои права, приняв соглашения об условиях обслуживания, предлагаемые основными платформами социальных сетей. Решение Reddit лицензировать публикации своих пользователей для OpenAI не произошло бы, если бы гигант социальных сетей считал, что его пользователи имеют законное право на мемы и данные, которые он распространяет.

Тот факт, что OpenAI и другие компании, создающие модели ИИ, заключают соглашения о контенте с крупными издателями, показывает, что сильный бренд, глубокие карманы и команда юристов могут привести к реализации крупных технологических операций.

Другими словами, те, кто создает контент и публикует его в Интернете, создают бесплатное программное обеспечение, если им не удастся удержать или привлечь юристов, готовых бросить вызов Microsoft и ей подобным.

в бумага В исследовании, опубликованном SSRN в прошлом месяце, Фрэнк Паскуале, профессор права Корнеллского технологического института и юридической школы Корнелла в США, и Хаочен Сунь, доцент права Гонконгского университета, исследуют правовую неопределенность, связанную с использованием данные, защищенные авторским правом, для обучения искусственного интеллекта и сочтут ли суды такое использование справедливым. Они приходят к выводу, что проблема искусственного интеллекта должна решаться на политическом уровне, поскольку действующие законы неадекватны для ответа на вопросы, которые сейчас необходимо решить.

READ  Google вводит дополнительные ограничения на функцию «Обзоры искусственного интеллекта» после того, как попросил людей наносить клей на пиццу

«Поскольку существует большая неопределенность относительно законности использования поставщиками услуг ИИ произведений, защищенных авторским правом, законодателям придется сформулировать смелое новое видение изменения баланса прав и обязанностей, как они это сделали после развития Интернета (ведущего к Закону об авторском праве тысячелетия и публикации цифровых материалов 1998 года), утверждают они.

Авторы отмечают, что продолжающийся неоплачиваемый сбор творческих работ угрожает не только писателям, композиторам, журналистам, актерам и другим творческим специалистам, но и самому генеративному ИИ, который в конечном итоге будет испытывать нехватку обучающих данных. Они прогнозируют, что люди перестанут делать работу доступной в Интернете, если привыкнут к использованию моделей искусственного интеллекта, которые сводят предельные затраты на создание контента к нулю и лишают создателей возможности какого-либо вознаграждения.

Это будущее, которое предвидит Соломон. «Экономика информации вот-вот радикально изменится, потому что мы можем снизить стоимость производства знаний до нуля с точки зрения предельных издержек», — сказал он.

Все бесплатное программное обеспечение, которое вы, вероятно, помогали создавать, может стать вашим за небольшую ежемесячную абонентскую плату. ®