9 ноября, 2024

Orsk.today

Будьте в курсе последних событий в России благодаря новостям Орска, эксклюзивным видеоматериалам, фотографиям и обновленным картам.

Google Gemini 1.5 Pro — новая, более эффективная модель искусственного интеллекта

Google Gemini 1.5 Pro — новая, более эффективная модель искусственного интеллекта

Четверг Google раскрыть Gemini 1.5 Pro, который компания описывает как предлагающий «значительно повышенную производительность» по сравнению с предыдущей моделью. Путь компании к искусственному интеллекту, который внутри компании рассматривается как критически важный для ее будущего, следует за презентацией Gemini 1.0 Ultra на прошлой неделе, а также за ребрендингом чат-бота Bard (на Gemini), чтобы он соответствовал более мощным и универсальным возможностям новой модели.

В своем анонсе в блоге генеральный директор Google Сундар Пичаи и генеральный директор Google DeepMind Демис Хассабис пытаются сбалансировать заверение своей аудитории в этической безопасности ИИ и рекламу возможностей своих быстро развивающихся моделей. «Наши команды продолжают расширять границы наших новейших моделей, в основе которых лежит безопасность», — подытожил Пичаи.

Компании необходимо подчеркнуть безопасность скептиков ИИ (в том числе бывшего топ-менеджера Google) и государственных регулирующих органов. Но ей также необходимо подчеркнуть ускоряющуюся производительность своих моделей для разработчиков ИИ, потенциальных клиентов и инвесторов, которые обеспокоены тем, что компания слишком медленно реагирует на успех OpenAI с ChatGPT.

Пичаи и Хассабис говорят, что Gemini 1.5 Pro обеспечивает результаты, аналогичные Gemini 1.0 Ultra. Однако Gemini 1.5 работает на этом уровне более эффективно и требует меньших вычислительных затрат. Мультимедийные возможности включают обработку текста, изображений, видео, аудио или кода. По мере развития моделей ИИ они будут продолжать предлагать более разнообразный набор возможностей в одном поле заявок (еще одним недавним примером является интеграция OpenAI для создания изображений DALL-E 3 в ChatGPT).

Alphabet и генеральный директор Google Сундар Пичаи присутствуют на открытии Центра искусственного интеллекта (ИИ) Google в Париже 15 февраля 2024 года. (Фото АЛЕН ЖОКАР/AFP) (Фото АЛЕН ЖОКАР/AFP через Getty Images)

Генеральный директор Google Сундар Пичаи (Ален Жокард через Getty Images)

Gemini 1.5 Pro также может обрабатывать до 1 миллиона токенов, а его модули моделирования данных на базе искусственного интеллекта могут обрабатывать их за один запрос. Google заявляет, что Gemini 1.5 Pro может обрабатывать более 700 000 слов, час видео, 11 часов аудио и кодовые базы с более чем 30 000 строк кода. Компания заявляет, что «успешно протестировала» версию, поддерживающую до 10 миллионов токенов.

READ  Vampire Survivors, лучшая игра 2022 года, получает финальное обновление

Компания заявляет, что Gemini 1.5 Pro поддерживает высокую точность запросов с большим количеством токенов, когда у него есть больше новых данных для изучения. Она говорит, что ей понравилась модель Иголка в стоге сена. В этом тесте разработчики вставляют небольшой фрагмент информации в длинный блок текста, чтобы проверить, сможет ли модель ИИ его уловить. Google заявил, что Gemini 1.5 Pro может находить встроенный текст в 99 процентах случаев в блоках данных длиной до 1 миллиона токенов.

Google утверждает, что Gemini 1.5 Pro может отражать различные детали из 402-страничных стенограмм лунной миссии Аполлона-11. Кроме того, он может анализировать сюжетные линии и события из загруженного 44-минутного немого фильма с Бастером Китоном в главной роли. «Поскольку длинное контекстное окно 1.5 Pro является первым в своем роде среди крупномасштабных моделей, мы постоянно разрабатываем новые оценки и тесты для тестирования его новых возможностей», — написал Хассабис.

Google запускает Gemini 1.5 Pro с возможностями 128 000 токенов такое же количество Вот где модели OpenAI GPT-4 (объявленные публично) достигают своего предела. Хассабис говорит, что Google в конечном итоге представит новые ценовые уровни, поддерживающие до 1 миллиона уникальных запросов.

НЬЮ-ЙОРК, НЬЮ-ЙОРК – 2 МАЯ: Демис Хассабис принимает участие в фестивале Future of Everything 2023 в WSJ в Spring Studios 2 мая 2023 года в Нью-Йорке.  (Фото Джой Мэлоун/Getty Images)НЬЮ-ЙОРК, НЬЮ-ЙОРК – 2 МАЯ: Демис Хассабис принимает участие в фестивале Future of Everything 2023 в WSJ в Spring Studios 2 мая 2023 года в Нью-Йорке.  (Фото Джой Мэлоун/Getty Images)

Генеральный директор Google DeepMind Демис Хассабис (Джой Мэлоун через Getty Images)

Gemini 1.5 Pro также умеет осваивать новые навыки на основе информации в длинных подсказках — без дополнительной настройки («обучение в контексте»). В стандарте под названием Машинный перевод одной книги,Модель выучила грамматику каламанга, языка, на котором говорят менее 200 человек по всему миру и которому раньше никогда не обучались. Компания заявляет, что Gemini 1.5 Pro изучает производительность на том же уровне, на котором человек изучает тот же контент при переводе с английского на каламанг.

READ  Аналитики прогнозируют, что Call of Duty: Black Ops 6 может увеличить количество подписчиков Game Pass до 4 миллионов, но ценой потери 6 миллионов продаж.

В части объявления, которая привлечет внимание разработчиков, Google сообщает, что Gemini 1.5 Pro может выполнять задачи по решению проблем с помощью более длинных блоков кода. «Когда им предоставляется подсказка, содержащая более 100 000 строк кода, они могут лучше рассуждать на примерах, предлагать полезные модификации и объяснять, как работают различные фрагменты кода», — пишет Хассабис.

Что касается этики и безопасности, Google заявляет, что применяет «тот же подход к ответственной публикации», что и в моделях Gemini 1.0. Это включает в себя разработку и применение техник «красной команды», когда группа этических разработчиков по сути действует как адвокаты дьявола, проверяя «ряд потенциального вреда». Кроме того, компания заявляет, что проводит тщательную проверку в таких областях, как целостность контента и репрезентативный ущерб. Компания заявляет, что продолжает разрабатывать новые тесты этики и безопасности для своих инструментов искусственного интеллекта.

Google выпускает ранний доступ к Gemini 1.5 для разработчиков и корпоративных клиентов. Компания планирует со временем сделать его более доступным. Gemini 1.0 в настоящее время доступен потребителям вместе с Профессиональная альтернатива Это стоит 20 долларов в месяц.