Ожидаемые нововведения в Kubernetes 1.36: ключевые изменения

Релиз Kubernetes 1.36, запланированный на 22 апреля, привносит ряд существенных улучшений, ориентированных на оптимизацию AI/ML-нагрузок, повышение надежности планировщика и усиление безопасности инфраструктуры. Рассмотрим наиболее значимые изменения, которые затронут работу кластеров в промышленной эксплуатации.

Оптимизация для AI/ML-задач

Одним из важнейших нововведений стало внедрение workload-aware preemption. Теперь группы взаимосвязанных подов, задействованных в распределенном обучении моделей, рассматриваются планировщиком как единое целое. Это предотвращает сценарии, при которых часть задач остается без ресурсов, что приводит к простою вычислительных мощностей и нецелевому расходу бюджета.

Дополнительно реализована возможность размещения группы подов внутри одного топологического домена на основе лейблов. Это критически важно для высоконагруженных ML-систем, где минимизация сетевых задержек (latency) между узлами напрямую влияет на общую скорость обучения.

Развитие Dynamic Resource Allocation (DRA)

Механизм DRA продолжает совершенствоваться. Ключевое нововведение — ResourcePoolStatusRequest, позволяющий получать прозрачную информацию о доступности GPU без необходимости сканирования всех ResourceClaims в неймспейсах. Кроме того, драйверы теперь поддерживают атрибуты устройств с несколькими PCIe-корнями, что расширяет возможности управления аппаратным обеспечением.

Улучшения планировщика и CSI

Для stateful-нагрузок введена строгая проверка доступности CSI-драйверов на узлах. Планировщик больше не допустит перемещение пода на узел, где отсутствует необходимая поддержка хранилища, что исключает ошибки при монтировании томов.

Масштабирование до нуля в HPA

Функция HPAScaleToZero, ожидавшая внедрения с версии 1.16, теперь активирована по умолчанию. Это позволяет полностью отключать поды в средах тестирования и staging, когда нагрузка отсутствует, что существенно оптимизирует потребление ресурсов в облачных средах.

Повышение безопасности при работе с образами

В целях усиления безопасности Kubelet переходит на использование ephemeral-токенов для аутентификации при получении образов (image pull). Отказ от статических секретов в пользу короткоживущих, автоматически ротируемых токенов, привязанных к identity конкретного пода, значительно снижает риски компрометации учетных данных.

Подробный технический разбор всех 20 новых alpha-функций доступен в материалах от Palark.