Учени искат да намалят консумацията на енергия на ChatGPT с по-ефективни чипове

HiEnd

07.09.2023

ChatGPT и други генеративни технологии за изкуствен интелект поразяват, а понякога и притесняват потребителите с човекоподобните си способности да водят разговори и да изпълняват задачи.

Но те предизвикват и безпокойство относно количеството енергия, необходимо за създаването и функционирането на системите. Изследовател от Вашингтонския университет оценява енергията, необходима за създаването на приложението ChatGPT, което беше пуснато в публичното пространство през ноември 2022 г., като установява, че за обучението на големия езиков модел, който стои зад него, са били необходими около 10 гигаватчаса (GWh) енергия. Това е равностойно на годишното потребление на енергия от около 1000 американски жилища.

Числото е приблизително и други изследователи са изчислили много по-малка консумация на енергия за създаването на GPT-3 и подобни по размер модели. Но GPT-3 е само началото. GPT-4, който е обучен на базата на много повече данни, и други нови модели поглъщат още повече енергия.

"Ако това ще бъде началото на революция и всеки иска да разработи свой собствен модел и всеки ще започне да ги използва - има милион различни приложения, - тогава това число ще става все по-голямо и по-голямо до степен, че няма да бъде устойчиво", казва Саджад Моазени, доцент по електротехника и компютърно инженерство в UW.

Моазени и други инженери искат да се справят с това предизвикателство. Те работят по решения за повишаване на енергийната ефективност на технологиите, които създават и управляват тези генеративни модели с изкуствен интелект.

В Центъра за компютърни науки и инженерство "Пол Г. Алън" на Университета на Калифорния Моазени има лаборатория, в която той и колегите му изследователи манипулират и модифицират свръхвисокотехнологични компютърни чипове с невъобразимо малки транзистори.

Тези чипове са в основата на GPT и други големи езикови модели и техните приложения. Те функционират като мозък на компютърни мрежи, които консумират и обработват данни. Чиповете разговарят помежду си и предават информация чрез електрически и оптични сигнали, действайки като метафоричните неврони на системата.

Моазени иска да подобри тази сигнализация, като включи фотоника, която ще позволи комуникация между чиповете чрез оптични сигнали, изпращани по оптични влакна, вместо използваните в момента по-неефективни и по-слабо ефективни електрически сигнали.

Големите езикови модели използват специални, енергоемки чипове, наречени графични процесори, или GPU. Графичните процесори и свързаната с тях електроника са съществена част от компютърните сървъри, които се намират в центровете за данни. Центровете за данни са мястото, където се намира "облакът".

Процесорите консумират енергия за работата си и отделят топлина, което налага използването на охлаждащи системи с вентилатори или вода, за да се предпазят машините от прегряване. Всичко това води до значително потребление на енергия.

Гигантските технологични компании, предлагащи услуги в облак, като Amazon Web Services, Azure на Microsoft и Google Cloud на Alphabet, притежават много от огромните центрове за данни, в които се обучават и работят инструментите за генеративен ИИ. Всички компании са поели ангажимент да намалят емисиите си на парникови газове до нула или по-малко и се стремят да използват възобновяеми енергийни източници, за да постигнат тези цели.

Но развитието на генеративния изкуствен интелект ще продължи да увеличава търсенето на центрове за данни. Това е нещо, което компаниите взeмат предвид, докато работят за постигане на целите за намаляване на въглеродните емисии. Amazon например очаква до 2025 г. всички нейни операции да се извършват от възобновяеми енергийни източници.

Снимка: Unsplash

Виж още: Изобретател твърди, че негов ИИ е разумен и се бори за авторски права върху творенията му

Тагове: