Збій на мільярди: як чипи Huawei обнулили місяці роботи над AI-моделлю DeepSeek

Сфера штучного інтелекту динамічно розвивається, і гонка за технологічне лідерство стала однією з найважливіших битв сучасності. Китай, прагнучи до технологічної незалежності, активно просуває власні рішення. Проте нещодавній інцидент з компанією DeepSeek став серйозним ударом по цим амбіціям. Спроба навчити їхню нову мовну модель R2 на вітчизняних чипах Huawei Ascend обернулася повним провалом, змусивши компанію повернутися до американських процесорів NVIDIA. Цей випадок наочно демонструє, наскільки складним і ризикованим може бути шлях до технологічної самодостатності, особливо у такій високотехнологічній галузі, як розробка AI.

Чому DeepSeek відмовилася від чипів Huawei?

Після успішного запуску своєї попередньої моделі R1 на чипах NVIDIA, DeepSeek опинилася під тиском з боку китайського уряду, який наполягав на використанні вітчизняного апаратного забезпечення. Компанія вирішила піти на цей крок, прагнучи підтримати місцеву індустрію. Протягом багатьох місяців інженери Huawei спільно з командою DeepSeek намагалися адаптувати систему для навчання на чипах Ascend. Проте, попри всі зусилля, проєкт зазнав краху. DeepSeek не змогла завершити жодного повного циклу навчання R2, що стало серйозним фінансовим і репутаційним ударом.

Технічні проблеми та їхні наслідки

Заявлені проблеми з чипами Huawei не були випадковими збоями, а вказували на глибокі системні недоліки. Серед основних причин, які завадили успішному навчанню:

  • Нестабільність чипів: Під час тривалих інтенсивних сесій навчання чипи Huawei Ascend виявляли нестабільність, що призводило до збоїв і переривало процес.
  • Повільне з’єднання: Швидкість передачі даних між чипами була недостатньою, що створювало «вузьке місце» і значно уповільнювало навчання моделі.
  • Недосконале програмне забезпечення: Екосистема та інструментарій для розробки AI на чипах Huawei виявилися недостатньо зрілими, що спричинило безліч проблем сумісності.
  • Проблема формату даних: Чипи Huawei Ascend не підтримували формат FP8, який є критично важливим для оптимізації навчання великих мовних моделей. Компанія була змушена використовувати менш ефективний 16-бітний формат, що збільшувало навантаження на обладнання та споживало більше ресурсів.

Політичний тиск та залежність від NVIDIA

Цей інцидент став наочним прикладом того, наскільки Китай, попри всі зусилля, все ще залежить від американських технологій, зокрема від NVIDIA. Чипи NVIDIA H20, які DeepSeek зрештою використала для навчання R2, хоч і мають меншу пропускну здатність, ніж їхні американські аналоги, є надзвичайно стабільними та підтримуються розвиненою програмною екосистемою. Ця подія показала, що в умовах, коли йдеться про високі ставки, надійність і зрілість технології є важливішими за теоретичні обіцянки.

Пекін все ще продовжує наполягати на використанні місцевих рішень, вимагаючи від компаній обґрунтовувати необхідність замовлень американських чипів. Проте історія DeepSeek яскраво демонструє, що без повноцінної та стабільної інфраструктури, яка дозволяє виконувати складні завдання, такі як навчання великих мовних моделей, китайські розробники AI будуть змушені втрачати час і кошти. Це може призвести до технологічного відставання в ключовій галузі.

У результаті провалу навчання на чипах Huawei випуск моделі R2 було відкладено. DeepSeek повернулася до процесорів NVIDIA для основних завдань, залишивши чипи Huawei лише для менш вимогливих обчислень. Ця ситуація підтверджує, що на шляху до технологічної незалежності недостатньо просто створити апаратне забезпечення. Не менш важливим є його надійність, програмна підтримка та відповідність сучасним потребам.

Ігор Кремнієв
Про автора

Ігор Кремнієв

Захоплюється інноваціями у виробництві чипів, новими стандартами пам'яті та екологічними матеріалами.

0 Коментарів

Відповісти

2500
Будь ласка, введіть коментар
Будь ласка, вкажіть ваше ім'я