Начало GameBox Новини Притежава ли Claude 3 човешки способности?

Притежава ли Claude 3 човешки способности?

12.03.2024

Войните на AI се задълбочават с пристигането на Claude 3

Преди борени дни Anthropic пусна Claude 3-семейство от три езика на AI. Моделите задават нови индустриални показатели в редица когнитивни задачи. Създателите твърдят, че в някои случаи се приближават до човешките възможности. Може да се възползвате от него сега чрез уебсайта на Anthropic, като най-мощният модел е само с абонамент.

Трите модела на Claude 3 представят нарастваща сложност и брой на параметрите: Claude 3 Haiku, Claude 3 Sonnet и Claude 3 Opus. Sonnet може да се ползва безплатно с вход по имейл, но Opus е достъпен само чрез интерфейс за уеб чат на Anthropic, ако плащате 20 долара на месец за „Claude Pro“.

Това е абонаментна услуга, предлагана чрез уебсайта на Anthropic. И трите разполагат с прозорец на контекста от 200 000 Token.

До неотдавна компанията изоставаше леко зад най-добрите модели на OpenAI в редица способности, като ги надминава по отношение на дължината на прозореца на контекста. Промяната настъпва с Claude 3.

Иновацията демонстрира усъвършенствани резултати в различни когнитивни задачи. В това число са разсъждения, експертни знания, математика и езикова точност. Моделът на Opus е най-способният от трите и проявява почти човешки нива на разбиране, и владеене на сложни задачи.

Това е доста ангажиращо твърдение и заслужава да бъде анализиран по-внимателно. Дори Opus да е почти човешки по някои специфични показатели, това не означава, че е с обща интелигентност като човек.

Анализ на способностите

Claude 3 Opus бие GPT-4 по 10 AI показатели. Тук включваме MMLU (знания на бакалавърско ниво), GSM8K (математика), Humaneval (кодиране) и Hellaswag (общи знания).

В сравнение с предшественика си, моделите Claude 3 показват подобрения спрямо Claude 2 в области като анализ, прогнозиране, създаване на съдържание, генериране на код и многоезичен разговор. Те разполагат с подобрени възможности за зрение. Това им позволява да обработват визуални формати като снимки, графики и диаграми, подобно на GPT-4V и Gemini на Google.

Смело усъвършенстване

Anthropic подчертава повишената скорост и рентабилност на трите модела в сравнение с предишните поколения. Opus (най-големият модел) е $15 за милион входни и $75 за милион изходни токена. Средният модел наречен Sonnet е $3 за милион входни и $15 за милион изходни токена. Най-малкият и най-бърз модел Haiku е $0,25 на милиона входни и $1,25 на милион изходни токена. За сравнение, GPT-4 Turbo на OpenAI чрез API е $10 за милион входни и $30 за милион изходни токени. GPT-3.5 Turbo е $0,50 за милион входни и $1,50 за милион изходни токена.

Моделите Claude 3 могат да обработват до 1 милион токени за избрани клиенти. Opus е постигнал почти перфектно извикване в бенчмарк тест в този огромен контекстен размер и превишава 99% точност. Новите модели са по-малко склонни да отказват безвредни подкани и демонстрират по-висока точност, като същевременно намаляват неправилните отговори.

Синтетични данни

Anthropic е постигнал подобрения в способностите на Claude 3 отчасти чрез използването на синтетични данни в процеса на обучение. Това са данни генерирани вътрешно с помощта на друг езиков модел на AI. Техниката може да служи като начин за разширяване на дълбочината на данните за обучение, за да представи сценарии, които евентуално липсват.

Anthropic планира чести актуализации на моделната фамилия Claude 3 през следващите месеци, заедно с нови функции като използване на инструменти, интерактивно кодиране и разширени агентски възможности. Компанията сподели, че остава ангажирана с мерките за безопасност са в крак с напредъка в производителността на AI.

Войните на AI се задълбочават с пристигането на Claude 3

Прочети за: