"Геймърските" графични процесори GeForce RTX 4090 на NVIDIA се превръщат в решения за изкуствен интелект в хиляди бройки, за да задоволят нарастващото търсене в Китай.
Неотдавна правителството на САЩ наложи големи ограничения на хардуера за изкуствен интелект в Китай. Съгласно новите разпоредби няколко доставчици на графични процесори, като NVIDIA, AMD и Intel, вече са блокирани да продават специфични чипове за изкуствен интелект в Китай. Забраната за графичните процесори на NVIDIA е най-тежката, като дори потребителските карти Geforce RTX 4090 са недостъпни в континентален Китай поради високите си изчислителни възможности.
Преди забраната, която влезе в сила преди няколко дни, се съобщаваше, че NVIDIA е насочила голяма част от графичните процесори AD102 и графичните карти GeForce RTX 4090 от своите партньори от AIB към Китай. Това приоритизиране може да е една от причините RTX 4090 да е в дефицит в останалата част на света и в момента цената на картата да надхвърля 2000 щатски долара. Не само това, но и китайските гиганти в областта на изкуствения интелект са натрупали голям запас от графични процесори NVIDIA, които биха могли да захранват поколения техни модели за изкуствен интелект.
Сега вътрешен източник от китайските форуми на Baidu разкри, че в цял Китай се създават специализирани фабрики, които получават тези пратки с GeForce RTX 4090 (изпратени преди забраната). На една снимка се виждат няколкостотин графични карти NVIDIA GeForce RTX 4090 от PALIT и се съобщава, че още толкова са на път. В основната тема са показани и варианти ASUS ROG STRIX и Gigabyte Gaming OC, които са снимани. Що се отнася до това за какво служат тези карти, ами очевидно не е за игри, ако това сте си помислили.
Нарастващите цени на графичните процесори NVIDIA GeForce RTX 4090 ги направиха недостъпни дори за сегмента на гейминга от висок клас с цени, близки до 10 000 долара за брой, но има един пазар, който е гладен за тези карти, и това е модалният сегмент на изкуствения интелект в Китай.
За целите на ИИ софтуерната екосистема вече е налице за RTX 4090 и тя не изисква почти никакви промени на софтуерно ниво, за да поддържа най-новите LLM. NVIDIA наскоро обяви въвеждането на TensorRT & TensorRT-LLM в компютрите с Windows 11, което го прави още по-достъпен. И така, софтуерната страна е готова, но какво да кажем за практичността на използването на геймърски дизайн в сървърна среда, за което са създадени тези фабрики.
Всяка карта е с дизайн с 3 или 4 слота, което означава, че тя заема изключително много място, което не е много подходящо за сървърна среда на ИИ. Затова работниците в тези фабрики разглобяват всяка карта на части. Първо се разглобяват масивните охладители, а след това всичко, включително графичният процесор и паметта GDDR6X, се отстранява от основната печатна платка. Посочва се, че е разработена специализирана "референтна" печатна платка, която дава нов живот на тези графични процесори AD102 и паметта GDDR6X.
Снимка: Unsplash
Виж още: Това са първите екипи за футбол на Луната