Сервери штучного інтелекту з рідинним охолодженням стикаються з вузькими місцями

Sep 30, 2024

Залишити повідомлення

 

 

 

Зі збільшенням поставок чіпів Blackwell готовність клієнтів використовувати рідинне охолодження також зростатиме.

Інсайдери галузі повідомляють, що постачання універсальних швидкороз'ємних пристроїв (UQD) для рідинного охолодження стає обмеженим, що може стати основною перешкодою для зростання рідинного охолодження серверів ШІ.

 

Виробники ODM для серверів повідомляють, що чіпи Blackwell AI від Nvidia, включаючи B100 і B200, почнуться в цьому році, тоді як рішення GB200 надійде в масове виробництво лише в кінці 2024 або 2025. Більшість клієнтів B100 і B200 все ще використовують конструкції повітряного охолодження. , але виробники ODM повідомляють про постійне зростання проникнення рідинного охолодження, передбачаючи, що готовність клієнтів використовувати рідинне охолодження також зросте зі збільшенням поставок мікросхем Blackwell.

 

Liquid-Cooled AI Servers

▲ Сервери штучного інтелекту з рідинним охолодженням

 

 

I Розширення потужностей для задоволення зростаючого попиту на рідинне охолодження

 

Відповідні компанії розширюють виробництво, щоб зустріти нову еру рідинного охолодження. Виробник теплових модулів Amlogic планує збільшити місячну виробничу потужність пластин водяного охолодження з 30 000 до 300 000 одиниць.

 

Компанія Auras створила нову фабрику в Таїланді, щоб вирішити геополітичні проблеми та вимоги клієнтів. Очікується, що ця фабрика почне масове виробництво в третьому кварталі. Окрім розширення місцевих виробничих потужностей для охолоджуючих пластин, Auras також планує виробляти блоки розподілу охолодження (CDU) і колектори розподілу охолоджуючої рідини (CDM) на місцевому рівні із запланованою місячною потужністю приблизно 2,000-3,{{2 }} набори.

 

Виробник теплових модулів AVC заявив у своєму нещодавньому фінансовому звіті, що його місячна виробнича потужність модулів охолоджувальних плит у Китаї та В’єтнамі становить близько 115000 одиниць, що означає місячний випуск близько 420000 одиниць, коли розраховується охолодженням плит.

 

До кінця року АВК планує збільшити потужності на 50%. AVC також планує збільшити місячну виробничу потужність для CDU до 1000 одиниць і для CDM до 30000 комплектів. AVC підкреслив, що цю заплановану потужність можна гнучко регулювати відповідно до вимог замовника.

 

Компанія Thermo Technology Goli Thermal Processing розширює свої потужності на заводі Zhongli в Тайвані через збільшення попиту клієнтів на рідинне охолодження. Очікується, що до кінця третього кварталу місячна потужність CDM зросте з 1,000 одиниць до 2,000 одиниць, а до кінця року – до 4,{{5} } одиниць, причому очікується, що річне виробництво CDU досягне 2000 одиниць до кінця року.

 

Ці виробники мають високі очікування щодо попиту на рідинне охолодження, головним чином через ефективність обчислень і стандарти PUE центрів обробки даних у Китаї та ЄС, але найважливішим фактором є скасування Nvidia обмежень щодо теплових характеристик для виробників чіпів.

 

 

II Швидке зростання рідинного охолодження призводить до дефіциту UQD

 

Оскільки промисловість з нетерпінням очікує настання ери рідинного охолодження, UQD став найбільшою перешкодою для зростання. Виробники теплових модулів відзначили, що постачання UQD останнім часом стало обмеженим. Хоча поточна частка ринку рідинного охолодження вимірюється лише однозначною цифрою, якщо в майбутньому вона зросте до двозначної цифри, UQD може стати важко отримати.

 

Постачальники UQD переважно походять з Європи та Сполучених Штатів, наприклад, великі американські компанії Parker Hannifin і CPC, швейцарська Staubli International, данська Danfoss і шведська Cejn. Тайванський гігант комплектуючих роз’ємів Lotes також активно виходить на ринок і почав поставки зразків.

 

Голова правління Anbo Technology Лян Чжицзянь зазначив, що оскільки рідинне охолодження в першу чергу спрямоване на уникнення витоків, а UQD є компонентами, які найбільш схильні до витоку, постачання UQD є найбільш обмеженим серед компонентів рідинного охолодження. Це не лише технічна проблема; відповідні виробники також мають патентний захист, і Anbo Technology досліджує шляхи подолання цих патентних бар’єрів.

 

Інсайдери галузі відзначили, що хоча виробники UQD мають патентний захист, вони також повинні проходити численні перевірки, включаючи сертифікацію OCP і клієнтські перевірки, які забирають багато часу та трудомісткі. Крім того, існуючі європейські та американські виробники не мають наміру збільшувати потужності, що стане головним вузьким місцем для швидкого розвитку рідинного охолодження.

 

Supermicro є одним із найбільш швидкозростаючих виробників рідинного охолодження. Засновник і генеральний директор Лян Цзяньхоу зазначив, що за останні 30 років рідинне охолодження становило лише 1% серверного ринку, але за його оцінками, до 2025 року рівень проникнення підскочить до 30%.

 

 

III Рідинне охолодження як потенційне рішення; AI бум тисне на сітку

 

Швидкий розвиток генеративного штучного інтелекту призвів до безпрецедентного розширення центрів обробки даних, викликаючи занепокоєння щодо їх впливу на енергосистему. Ці енергоємні об’єкти можуть призвести до знеструмлення та збільшення витрат на електроенергію. За оцінками Інституту досліджень електроенергії, до 2030 року центри обробки даних можуть споживати 9% електроенергії Сполучених Штатів, подвоївши нинішню цифру. Споживання електроенергії великого центру обробки даних еквівалентно споживанню сотнями тисяч домогосподарств.

 

Особливе занепокоєння викликає зростаючий попит на електроенергію з боку штучного інтелекту. Ранні моделі штучного інтелекту споживали в десять разів більше енергії, ніж пошук у Google, тоді як нові чіпи потребують ще більше енергії. Експерти попереджають, що майбутній розвиток штучного інтелекту може бути обмежений нашою здатністю генерувати достатню потужність.

 

Деякі країни стикаються з серйозними проблемами. Наприклад, до 2026 року в Ірландії 30% електроенергії може витрачатися на центри обробки даних. У США центри обробки даних споживають електроенергію в 15 штатах, причому Техас і Вірджинія є найвищими. Каліфорнія перебуває в критичній ситуації, оскільки очікується, що нові центри обробки даних вироблятимуть потреби в електроенергії, що перевищуватимуть потреби атомних електростанцій.

 

 

IV Центри обробки даних: величезне споживання енергії та зростання рідинного охолодження

 

Вимоги до обчислень штучного інтелекту підвищують температуру серверів і викиди вуглекислого газу, що призводить до значного зростання попиту на системи охолодження. На системи охолодження припадає 40% загального енергоспоживання центру обробки даних, що робить їх другим за величиною джерелом енергоспоживання після самих серверів. Очікується, що глобальний ринок систем охолодження серверів зросте з 20 мільярдів доларів США у 2024 році до 90 мільярдів доларів США до 2027 року. Очікується, що ринок систем рідинного охолодження в центрах обробки даних зросте з 1% до 22%, а ринкова вартість, за прогнозами, зросте з 317 мільйонів доларів США до 7,8 мільярдів доларів у наступні три роки.

 

Рідинні системи охолодження, які використовують воду або охолоджувачі для охолодження серверів, стають все більш популярними. Нові технології включають занурювальне охолодження (занурення всієї серверної стійки в непровідні рідини) і пряме рідинне охолодження (циркуляція води навколо серверів). Хоча наразі рідинне охолодження дорожче, ніж системи повітряного охолодження, воно може зменшити енергоспоживання центру обробки даних на 10% і більше.

 

Дослідницька компанія Global Market Insights прогнозує, що світовий ринок рідинного охолодження для центрів обробки даних зросте з 2,1 мільярда доларів США у 2022 році до 12,2 мільярда доларів США до 2032 року. Опитування Uptime Institute показало, що 16% керівників центрів обробки даних вважають, що рідинне охолодження стане основним охолодженням. через 1-3 років, тоді як 41% вважають, що це займе 4-6 років. Тому гібридні методи охолодження, швидше за все, з’являться в короткостроковій перспективі.

 

Upsite Technologies, лідер в управлінні системами повітряного охолодження для центрів обробки даних, зазначив, що, незважаючи на постійний прогрес технологій, досягнення 100% рідинного охолодження центрів обробки даних малоймовірно в короткостроковій перспективі, оскільки рідинне охолоджувальне обладнання все ще вимагає повітряного охолодження для розсіювання тепла. . Хоча рідинне охолодження є більш ефективним, його складно реалізувати у великих масштабах і вимагає значних початкових інвестицій. Повітряне охолодження є менш дорогим, але також менш ефективним. Таким чином, гібридні системи охолодження стають все більш популярними, щоб максимізувати переваги як рідинного, так і повітряного охолодження.

 

 

V Енергетична криза центрів обробки даних вимагає термінових дій

 

Через вплив на навколишнє середовище центри обробки даних отримують все більшу увагу. Уряди в усьому світі впроваджують правила, щоб контролювати споживання енергії та вуглецевий слід. Прикладом цієї тенденції є принципи «зеленого центру даних» Китаю та подібні ініціативи в Німеччині, Сінгапурі та Японії. Галузеві експерти, такі як Schneider Electric, наголошують на необхідності комплексних показників навколишнього середовища для оцінки стійкості центрів обробки даних, включаючи фактори, окрім споживання енергії, такі як водні ресурси та утворення відходів.

 

Уряд США чинить тиск на великі технологічні компанії, щоб вони інвестували в чисту енергію та визнавали значний вплив зростаючих потреб штучного інтелекту в навколишнє середовище.

 

 

VI Пошук відповідних джерел живлення: центр обробки даних та енергетичні проблеми

 

Центри обробки даних потребують диверсифікованого енергетичного балансу, щоб збалансувати надійність і стійкість і відповідати зростаючим вимогам. Відновлювані джерела енергії, такі як сонце та вітер, є привабливими через низький вуглецевий слід. Однак їх залежність від погодних умов може призвести до нестабільного виходу, що робить їх непридатними як єдине джерело живлення для центрів обробки даних. Створення резервних засобів для компенсації цієї невідповідності може бути необхідним, але дорогим.

 

Атомна енергетика стала потенційним рішенням. Традиційні атомні електростанції забезпечують надійне електропостачання базового навантаження, генеруючи стабільну електроенергію, що має вирішальне значення для роботи центрів обробки даних. Крім того, очікується, що глобальний ринок ядерної енергії досягне стабільного зростання протягом наступного десятиліття.

 

Інновації в ядерній галузі пропонують більш перспективні можливості. Малі модульні реактори (SMR) розробляються як менші, безпечніші та більш масштабовані альтернативи традиційним атомним електростанціям. Незважаючи на те, що SMR все ще знаходяться на стадії досліджень і розробок, SMR мають потенціал для розгортання безпосередньо в центрах обробки даних, забезпечуючи виділену чисту енергію.

 

Global liquid cooling market (US$b)

▲ Глобальний ринок рідинного охолодження (млрд доларів США)

 

 

Однак широке впровадження SMR стикається зі значними перешкодами. Регуляторні та виробничі проблеми можуть затримати їх комерційне впровадження на кілька років. Уряд США активно шукає рішення, включаючи партнерство з технологічними гігантами для зниження витрат і оптимізації процесів.

 

Ще один спосіб зменшити енерговитрати центрів обробки даних — це оптимізувати навантаження на штучний інтелект. Перемістивши деякі завдання ШІ з хмари на локальні пристрої за допомогою менших, менш ресурсомістких моделей ШІ, можна зменшити загальне споживання енергії.

 

Майбутній розвиток центрів обробки даних вимагає багатогранного підходу. Застосування диверсифікованого енергетичного комплексу, включаючи надійні джерела енергії, такі як атомна енергетика, водночас активний пошук відновлюваних та інноваційних рішень, таких як SMR, є важливим. Крім того, оптимізація робочого навантаження штучного інтелекту на локальних пристроях може ще більше сприяти стійкості центрів обробки даних.

 

 

 

Послати повідомлення