На конференцията WWDC 2024 Apple обяви множество функции с изкуствен интелект за iPhone, iPad, Mac и Siri, но изненадващо не уточни какви генеративни модели на изкуствен интелект ще използва за тяхното управление. Въпреки че слуховете сочеха, че компанията ще разчита на ChatGPT на OpenAI или Gemini на Google, те се оказаха само наполовина верни. Например, въпреки че интеграцията на ChatGPT наистина ще се появи в iOS, iPadOS и macOS по-късно тази година, тя няма да захранва обновената Siri или други функции на Apple Intelligence.
Но благодарение на нова публикация в блога за изследвания на машинното обучение на Apple вече знаем повече за стратегията на компанията за изкуствен интелект за 2024 г. и след това. Като начало компанията ще разчита на собствените си големи езикови модели (LLM), а не на лицензиране на предложения на трети страни като Google и OpenAI.
Apple казва, че нейните основополагащи модели са „прецизирани за потребителски изживявания, като писане и усъвършенстване на текст, приоритизиране и обобщаване на известия, създаване на игриви изображения за разговори със семейството и приятелите и предприемане на действия в приложенията за опростяване на взаимодействията в различните приложения“. След това в публикацията в блога се разглеждат някои от техническите аспекти, стоящи зад моделите с генеративен изкуствен интелект, като основният акцент е върху оптимизацията за ниска латентност и производителност на устройството.
По-важното обаче е, че по този начин за първи път се запознаваме с производителността на моделите с изкуствен интелект на Apple и как те се представят в сравнение с конкуренцията.
В една графика например виждаме, че човешките оценители са предпочели отговорите от облачния модел на Apple в около 50% от случаите в сравнение с GPT-3.5, който е базовият модел, предлаган с безплатната версия на ChatGPT. Двата модела са с равен брой гласове в 25.3% от случаите, което показва, че GPT-3.5 печели категорично само в 24.7% от тестовите случаи.
Въпреки това при сравнението на облачния модел с GPT-4 Turbo преднината на Apple се сви до едва 28.5%. Той обаче постигна равенство в още 29.8% от случаите.
Моделът на Apple в устройството също се представя чудесно, като в повечето от тестваните отговори той или побеждава, или не изостава от такива като Mistral-7B и Gemma-2B.
Моделът на Apple в устройството има приблизително три милиарда параметъра. Използвайки типични техники за оптимизация на модела като квантуване, той е достатъчно компактен, за да работи на устройства като iPhone 15 Pro и 15 Pro Max с едва 8 GB RAM.
Базираният на облак модел, от друга страна, е по-голям и по-мощен. Въпреки че Apple не е посочила изрично размера на облачния модел, той е проектиран да работи изцяло в центрове за данни, захранвани от Apple Silicon. Последното е важна победа за лоялните към Apple потребители, тъй като компанията може да гарантира, че техните чувствителни данни никога няма да бъдат предадени на компания от трета страна като OpenAI.
Що се отнася до безопасността, Apple твърди, че моделите на нейната платформа са значително по-безопасни и от конкуренцията. Базираният в облака модел на компанията връща „нарушаващи отговорите за вредно съдържание, чувствителни теми и фактология“ само в 6.6% от случаите, което е далеч по-малко от 15.5% при GPT-3.5 Turbo и 20.1% при GPT-4 Turbo.
Снимка: Unsplash
Виж още: Нов модел с изкуствен интелект предсказва човешкото поведение с невероятна точност