Компания OpenAI представила новую версию ChatGPT, основанную на новой технологии искусственного интеллекта под названием OpenAI o1. Каковы новые возможности и чем новая версия лучше для ученых?
12 сентября компания OpenAI представила новую версию виртуального помощника ChatGPT основанную на новой технологии искусственного интеллекта OpenAI o1. С момента запуска первой версии ChatGPT в 2022 году, чат-бот постоянно совершенствовался, предоставляя пользователям новые возможности. В этой статье мы рассмотрим последние обновления и выясним, чем новая версия отличается от предыдущих и чем она лучше.
Демонстрация и возможности нового ChatGPT
Компания OpenAI заявила, что чат-бот, основанный на технологии OpenAI o1, способен «рассуждать», решая задачи, связанные с математикой, кодированием и наукой.
Во время демонстрации для The New York Times чат-боту были представлены некоторые головоломки и заданы вопросы по химии, на которые он отвечал на уровне доктора философии, и диагностировал болезнь на основе детального отчета о симптомах и истории болезни пациента.
Компания также отметила, что новая технология может помочь физикам генерировать сложные математические формулы и помогать исследователям в области здравоохранения в их экспериментах.
Специалисты научили эти модели тратить больше времени на анализ проблем перед тем, как предоставить ответ, подражая подход человека. Благодаря этому процессу обучения, модели улучшают свое мышление, испытывают различные стратегии и способны признавать свои ошибки.
Необходимость в совершенствовании искусственного интеллекта
ChatGPT учился, анализируя большие объемы текста из различных источников в интернете, в частности статей из Википедии, книг и чатов. Анализируя шаблоны в текстах, он получил способность самостоятельно генерировать новый текст. Однако, из-за распространенности ложной информации в интернете, модель может воспроизводить эти неточности, а иногда даже придумывать их.
Разработчики создали новую систему OpenAI, используя метод обучения с подкреплением, благодаря которому система учится через многочисленные попытки и ошибки, что может длиться от недель до месяцев. Например, при решении математических задач система обнаруживает, какие методы приводят к правильному результату, а какие - нет. После выполнения большого количества таких задач она начинает замечать закономерности, но это не означает, что ее мышление подобно человеческому. Технические специалисты OpenAI подчеркивают, что система все еще может делать ошибки и не является идеальной, но пользователи могут ожидать, что она будет работать усерднее и с большей вероятностью будет давать правильные ответы.
Тестирование новой технологии OpenAI o1
OpenAI заявила, что новая технология показала лучшие результаты, чем предыдущие технологии, на некоторых стандартизированных тестах.
В тестах новая версия модели демонстрирует результаты на уровне аспирантов в сложных контрольных заданиях по физике, химии и биологии. Модель также показывает отличные результаты в математике и программировании. На экзамене AIME 2024 года модель GPT-4o смогла решить в среднем лишь 12% (1,8/15) задач. В то же время модель o1 достигла 74% (11,1/15) решений при одном подходе на задачу, 83% (12,5/15) при консенсусе среди 64 попыток и 93% (13,9/15) при переранжировании 1000 попыток с использованием изученной функции оценивания. Результат 13,9 балла позволяет попасть в топ-500 студентов на национальном уровне и превышает проходной балл для участия в математической олимпиаде США.
Модель, инициализированная на базе o1 и усовершенствованная для программирования, набрала 213 баллов и вошла в 49-й процентиль на Международной олимпиаде по информатике (МОИ) 2024 года. В условиях реального соревнования было отведено 10 часов для решения 6 алгоритмических задач с 50 попытками на каждую. Заявки оценивались на основе публичных и сгенерированных тестов. Если выбирать ответы случайным образом, средний результат составил бы всего 156 баллов, что указывает на то, что примененная стратегия добавила почти 60 баллов в условиях жесткой конкуренции. При смягченных ограничениях на количество попыток модель достигла 362,14 балла, превысив порог для получения золотой медали. На платформе Codeforces модель GPT-4o получила рейтинг Elo3 808, что соответствует 11-му процентилю среди людей.
Доступ к новому ChatGPT
Доступ к новой технологии начался 12 сентября для потребителей и компаний, которые подписались на услуги ChatGPT Plus и ChatGPT Teams. Компания также продает технологию разработчикам программного обеспечения и компаниям, которые создавали собственные приложения с искусственным интеллектом.
Пользователи ChatGPT Enterprise и Edu получат доступ к обеим моделям с 16 сентября. OpenAI планирует предоставить доступ к o1-mini всем бесплатным пользователям ChatGPT, но точная дата выпуска пока не определена.
Доступ разработчиков к o1 является дорогим: в API o1-preview плата составляет 15 долларов США за 1 миллион входных токенов и 60 долларов США за 1 миллион выходных токенов. Для сравнения, использование GPT-4o обойдется в 5 долларов за 1 миллион входных токенов и 15 долларов за 1 миллион выходных токенов.
Новые возможности для ученых и исследователей
Новая технология OpenAI o1 открывает перед учеными и исследователям много новых возможностей, одними из которых являются:
- Лучшие аналитические возможности. Благодаря быстрому решению сложных задач ученые смогут быстрее проводить анализ и находить нужное решение. Также благодаря новой технологии быстрее обрабатываются большие объемы данных, что значительно экономит время при проведении исследований.
- Оптимизация литературного обзора. Модель может быстро обрабатывать большое количество научных источников и помогать создавать качественные литературные обзоры, что экономит время ученым при подготовке статей и исследований.
- Улучшение качества текста. ChatGPT o1 позволит авторам более качественно и точно редактировать текст научной работы, исправлять ошибки и делать предложения для улучшения качества текста. Особенно важно это для тех авторов, которые готовят работу на иностранном языке.
o1 – и его последователи – откроют много новых возможностей использования ИИ в науке, кодировании, математике и смежных областях. В ближайшее время пользователи и разработчики узнают, как это может улучшить их повседневную работу.
Новая технология от компании OpenAI делает подготовку научных исследований и написание научных работ более эффективной. Однако следует помнить, что она не является идеальной и может допустить ошибку. Хотя такие инструменты, как ChatGPT, могут быть полезными при подготовке статей, они никогда не смогут полностью заменить личный вклад автора.
Подписывайтесь на наши социальные сети, чтобы быть в курсе последних новостей и полезной информации.