Meta представи на обществеността LLama 2

HiEnd

19.07.2023

Тази седмица Meta обяви Llama 2 - нова фамилия езикови модели с отворен код с изкуствен интелект, която се отличава с търговския си лиценз, което означава, че моделите могат да бъдат интегрирани в търговски продукти за разлика от своя предшественик. Те варират по размер от 7 до 70 милиарда параметъра и според Meta "превъзхождат чат моделите с отворен код при повечето тествани от нас сравнителни показатели".
"Това ще промени пейзажа на пазара на LLM", написа в Twitter главният учен по изкуствен интелект Ян Лекун. "Llama-v2 е налична в Microsoft Azure и ще бъде налична в AWS, Hugging Face и други доставчици".
Според Meta нейните "предварително обучени" модели Llama 2 са обучени върху 2 трилиона лексеми и имат контекстен прозорец от 4096 лексеми (фрагменти от думи). Контекстният прозорец определя дължината на съдържанието, което моделът може да обработи наведнъж. Meta също така казва, че моделите за фина настройка на Llama 2, разработени за чат приложения, подобни на ChatGPT, са обучени на "над 1 милион човешки анотации".
Въпреки че не може да се сравнява с GPT-4 на OpenAI по производителност, Llama 2 очевидно се справя добре за модел с отворен код.

Според Джим Фан, старши научен сътрудник по изкуствен интелект в Nvidia, "70B е близо до GPT-3.5 при задачите за разсъждаване, но има значителна разлика при бенчмарковете за кодиране. Той е на едно ниво или по-добър от PaLM-540B при повечето бенчмаркове, но все още е далеч зад GPT-4 и PaLM-2-L".
През февруари Meta пусна предшественика на Llama 2, LLaMA, като отворен код с некомерсиален лиценз. Официално достъпен само за учени с определени пълномощия, съвсем скоро файловете, съдържащи стойностите на параметрите на обучените невронни мрежи на LLaMA се появиха в торент сайтове и се разпространиха широко в общността на изкуствения интелект. Скоро последваха и фино настроени варианти на LLaMA като Alpaca, които дадоха началото на бързо развиваща се подземна сцена за разработка на LLM.
Llama 2 извежда тази дейност по-пълноценно на светло с разрешението си за комерсиална употреба, въпреки че потенциалните лицензополучатели с "повече от 700 милиона месечни активни потребители през предходния календарен месец" трябва да поискат специално разрешение от Meta, за да го използват, което потенциално изключва свободното му използване от гиганти с размерите на Amazon или Google.

Снимки: Unsplash

Виж още: Защо популярността на ChatGPT намалява?

Тагове: