OpenAI пуска модел със способности за разсъждение

OpenAI пуска нов езиков модел. Той ще бъде първият от планирана серия модели за „разсъждение“. Те са обучени да отговарят на по-сложни въпроси, по-бързо, отколкото може да го направи човек. Иновацията ще се появи заедно с О1-mini. Това е по-малка, по-евтина версия. Ако вече сте чули слухове за него, това всъщност е изключително нашумелият модел Strawberry.

За OpenAI О1 представлява стъпка към по-широка цел за човекоподобен изкуствен интелект. Той ще върши по-добра работа при писане на код и решаване на многоетапни проблеми. Също така е по-скъп и по-бавен за използване от GPT-4. OpenAI нарича версията О1 „предварителен преглед“, за да подчертае колко зараждаща е тя.

Безплатен достъп

Потребителите на ChatGPT Plus и Team получават достъп както до О1-preview, така и до О1-mini. OpenAI планира да предостави О1-mini на всички безплатни потребители на ChatGPT. Все още не е определена дата на пускане. Достъпът на разработчиците до О1 е наистина скъп: в API О1-preview е $15 за 1 милион входни токени или части от текст, анализирани от модела. $60 ще струват 1 милион изходни токени. За сравнение GPT-4 струва $5 за 1 милион входни токени и $15 за 1 милион изходни.

Обучението тук е фундаментално различно от предшествениците му. О1 е обучен с помощта на напълно нов алгоритъм за оптимизация и нов набор от данни, специално пригоден за него.

OpenAI обучи предишни GPT да имитират модели от своите данни за обучение. С О1 той обучи модела да решава проблеми сам, използвайки техника, известна като обучение с подсилване. Тя учи системата чрез награди и наказания. След това използва верига от мисли, за да обработва заявки, подобно на това как хората обработват проблеми, като ги разглеждат стъпка по стъпка.

В резултат на тази нова методология за обучение, моделът трябва да бъде по-точен. Основното нещо, което отличава този нов модел от GPT-4, е способността му да се справя със сложни проблеми. Такива са кодиране и математика.

Успешно състезание

В онлайн състезания по програмиране, известни като състезания на Codeforces, този нов модел достигна 89-ия персентил от участници. OpenAI твърди, че следващата актуализация ще се представи подобно на докторантите при предизвикателни бенчмарк задачи по физика, химия и биология.

В същото време О1 не е толкова способен като GPT-4 в много области. Не се справя толкова добре с фактическото познание относно света. Освен това няма възможност да сърфира в мрежата или да обработва файлове и изображения. Все пак компанията вярва, че представя съвсем нов клас възможности.

Моделът буферира за 30 секунди и след това дава правилен отговор. OpenAI е проектирал интерфейса, за да покаже стъпките на разсъждение. GPT-4 може да направи това, ако бъде подканен, а О1 имитира човешки фрази като „Любопитно ми е“, „Обмислям“ и „Добре, нека да видя“. Това създават илюзия за мислене.

OpenAI може би не вярва в приравняването на мисленето на AI модел с човешкото такова. Но интерфейсът има за цел да покаже как моделът прекарва повече време в обработка и решаване на проблеми.

Големите езикови модели не са толкова умни, колкото си мислим. По същество те просто предвиждат поредици от думи, за да ни дадат отговор въз основа на модели, научени от огромно количество данни.

Финансиране

OpenAI се стреми да набере по-голямо финансиране при внушителна оценка от 150 милиарда долара. Успехът на компанията зависи от повече изследователски пробиви. Тя предоставя възможности за разсъждение на LLM, защото вижда бъдеще с автономни системи или агенти, които са способни да вземат решения и да предприемат действия от ваше име.

За изследователите на изкуствен интелект разбиването на разсъжденията е следващата стъпка към интелигентност на човешко ниво. Мисълта е, че ако един модел е способен на повече от разпознаване на образи, той може да направи пробиви в области като медицина и инженерство. Засега обаче способностите за разсъждение са сравнително бавни и скъпи за използване от разработчиците. По същество това е нова модалност, за да могат да се решават наистина трудните проблеми. Именно това е необходимо, за да се доближат към човешките нива на интелигентност.