Сфера искусственного интеллекта динамично развивается, и гонка за технологическое лидерство стала одним из важнейших сражений ХХ века. Китай, стремясь к технологической независимости, активно продвигает свои решения. Однако недавний инцидент с компанией DeepSeek стал серьезным ударом по этим амбициям. Попытка научить их новую языковую модель R2 на отечественных чипах Huawei Ascend обернулась полным провалом, заставив компанию вернуться к американским процессорам NVIDIA. Этот случай наглядно демонстрирует, насколько сложным и рискованным может оказаться путь к технологической самодостаточности, особенно в такой высокотехнологичной отрасли, как разработка AI.
Почему DeepSeek отказалась от чипов Huawei?
После успешного запуска своей предыдущей модели R1 на чипах NVIDIA, DeepSeek оказалась под давлением со стороны китайского правительства, которое настаивало на использовании отечественного аппаратного обеспечения. Компания решила пойти на этот шаг, стремясь поддержать местную индустрию. В течение многих месяцев инженеры Huawei совместно с командой DeepSeek пытались адаптировать систему обучения на чипах Ascend. Однако, несмотря на все усилия, проект потерпел крах. DeepSeek не смогла завершить ни одного полного цикла обучения R2, что явилось серьезным финансовым и репутационным ударом.
Технические проблемы и их последствия
Заявленные проблемы с чипами Huawei не были случайными сбоями, а указывали на глубокие системные недостатки. Среди основных причин, помешавших успешному обучению:
- Нестабильность чипов: Во время длительных интенсивных сессий обучения чипы Huawei Ascend обнаруживали нестабильность, что приводило к сбоям и прерывало процесс.
- Медленное соединение: скорость передачи данных между чипами была недостаточной, что создавало «узкое место» и значительно замедляло обучение модели.
- Несовершенное программное обеспечение: Экосистема и инструментарий для разработки AI на чипах Huawei оказались недостаточно зрелыми, что повлекло за собой множество проблем совместимости.
- Проблема формата данных: Чипы Huawei Ascend не поддерживали формат FP8, который критически важен для оптимизации обучения большим языковым моделям. Компания была вынуждена использовать менее эффективный 16-битный формат, что увеличивало нагрузку на оборудование и потребляло больше ресурсов.
Политическое давление и зависимость от NVIDIA
Этот инцидент стал наглядным примером того, насколько Китай, несмотря на все усилия, все еще зависит от американских технологий, включая NVIDIA. Чипы NVIDIA H20, которые DeepSeek в конце концов использовала для обучения R2, хотя и имеют меньшую пропускную способность, чем их американские аналоги, чрезвычайно стабильны и поддерживаются развитой программной экосистемой. Это событие показало, что в условиях, когда речь идет о высоких ставках, надежности и зрелости технологии важнее теоретических обещаний.
Пекин все еще продолжает настаивать на использовании местных решений, требуя от компаний доказывать необходимость заказов американских чипов. Однако история DeepSeek ярко демонстрирует, что без полноценной и стабильной инфраструктуры, позволяющей выполнять сложные задачи, такие как обучение большим языковым моделям, китайские разработчики AI будут вынуждены терять время и деньги. Это может привести к технологическому отставанию в ключевой отрасли.
В результате провала обучения на чипах Huawei выпуск модели R2 был отложен. DeepSeek вернулась к процессорам NVIDIA для основных задач, оставив чипы Huawei только для менее требовательных вычислений. Эта ситуация подтверждает, что на пути к технологической независимости недостаточно просто создать аппаратное обеспечение. Не менее важна его надежность, программная поддержка и соответствие современным потребностям.
0 Comments