Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
Kubernetes — ПО для работы с контейнерными приложениями / Хабр

Все потоки

Kubernetes *

ПО для работы с контейнерными приложениями

94,84

Рейтинг

СтатьиПостыНовостиАвторыКомпании

sergey_ist вчера в 12:34

Простая сложная VictoriaMetrics

Средний

17 мин

6.9K

Блог компании KTSDevOps * Kubernetes *

Туториал

Привет, я Сергей Истомин, DevOps-инженер в KTS. А ниже моя история про построение мультитенантного скоупа кластеров VictoriaMetrics с разными периодами хранения метрик.

Статья будет о том, как собрать систему одновременно и простую, и сложную. Простую потому, что каждый поток данных в ней лаконичный и линейный, и сложную потому, что совокупности этих потоков комбинируются и интегрируются в общие компоненты. Система будет построена на редакции Community Edition.

Надеюсь, что я вас хорошенько запутал и при этом заинтриговал.

Читать далее

+13

kubelet вчера в 08:25

Загадка ядра Linux: почему на 36 vCPU Cilium падает, а на 32 — нет

Средний

12 мин

7.5K

Блог компании ФлантDevOps * Kubernetes * Linux *

Кейс

Перевод

На кону финансовые данные клиентов, а странный и неуловимый баг в Cilium не даёт как следует настроить сетевую безопасность.

Статья о том, почему любая «нерешаемая» проблема — это «пока недостаточно изученная» проблема. От случайных догадок — к системному исследованию и пул-реквесту с фиксом прямо в Linux.

Читать далее

+13

levashove вчера в 08:21

Что kubectl debug вам не показывает: незаметный пробел в данных

7 мин

6.8K

Блог компании VK TechKubernetes * Системное администрирование * IT-инфраструктура * DevOps *

Перевод

Команда VK Cloud перевела статью для тех, кто разбирает инциденты в Kubernetes с помощью kubectl debug. Автор разбирает незаметный пробел в данных: после завершения debug-сессии API Kubernetes не сохраняет контекст ее завершения — код возврата, длительность сессии и целевой контейнер исчезают при первом же изменении состояния пода. В статье как воспроизвести это тремя командами, почему так устроено на уровне спецификации API, чем это грозит при разборе инцидентов и комплаенсе и что можно сделать уже сегодня.

Читать далее

+14

dbraincloud 4 июн в 13:25

VictoriaLogs vs Loki vs Elasticsearch

Средний

5 мин

8.3K

Блог компании dBrainKubernetes * Микросервисы * IT-инфраструктура * DevOps *

Кейс

Привет, Хабр! В этой статье разбираем плюсы и минусы VictoriaLogs как решения для логирования в облачной платформе.

Читать далее

+4

WH_Rain 4 июн в 09:40

От Prometheus к Victoria Metrics: как мы пересобрали мониторинг в Kubernetes

Сложный

14 мин

8.5K

Блог компании NavioKubernetes * DevOps *

Кейс

1. Введение

Всем привет! Меня зовут Яблоков Олег, я — ведущий инженер ИТ-отдела Navio и отвечаю за систему мониторинга основной инфраструктуры компании. Это работа на стыке разработки и эксплуатации (development & operations, DevOps), наблюдаемости (Observability) и обеспечения надёжности сервисов (Site Reliability Engineering, SRE). Моя основная задача не просто собирать метрики, а сделать так, чтобы по ним можно было быстро понять статусы сервисов и не утонуть в шуме оповещений.

Когда я пришел в компанию около года назад, система мониторинга уже существовала и закрывала базовые задачи. В наборе технологий использовались Prometheus, Thanos, Alertmanager, Grafana, Elasticsearch и различные наборы оповещений. Со временем количество компонентов и инструментов увеличилось, что усложнило их сопровождение и масштабирование.

В этой статье я расскажу, как происходила миграция мониторинга в Kubernetes, почему в качестве основной базой данных временных рядов (Time Series Database, TSDB) была выбрана Victoria Metrics, как мониторинг связали с Gitlab и Argo CD, пересобрали систему оповещений (alerting) и начали постепенно двигаться от инфраструктурного мониторинга к сервисному подходу и практикам обеспечения надёжности сервисов (Site Reliability Engineering, SRE).

2. С чего все начиналось.

Изначально мониторинг представлял собой связку Prometheus, Thanos, Alertmanager, Grafana и Elasticsearch. Разворачивалось все через Docker Compose на отдельных серверах, а сама система постепенно росла вместе с инфраструктурой.

Читать далее

+7

kishmishl 4 июн в 09:29

Может ли Service сломать ваш K8s кластер?

Средний

37 мин

7.5K

Блог компании VK TechБлог компании VKKubernetes * DevOps * Информационная безопасность *

Привет, Хабр! Меня зовут Михаил, я backend-разработчик в команде Managed Kubernetes в VK Cloud. При работе с K8s всем нам приходится сталкиваться с множеством конфигураций, которые мы используем постоянно, и Service не является исключением. И вот тут мне стало любопытно: а может ли с виду безобидный конфиг Service сломать нам весь кластер? Ну или хотя бы подпортить жизнь какому-то сервису?

Зачем мне это? Во-первых, это просто интересно: сломать что-то, понять, как оно работает, узнать, как то, что кажется обыденностью, может стать проблемой. Во-вторых, если удастся что-то накопать, то мы получим список потенциальных ошибок нашего кластера и будем думать над способами защиты и обнаружения. Так что приступим!

Статья будет полезна DevOps, безопасникам, админам и просто юным любителям Kubernetes.

Читать далее

+21

VShulcz 3 июн в 09:38

Model Predictive Control для Kubernetes autoscaling: что получилось, где HPA оказался сильнее

Средний

9 мин

6.8K

Kubernetes * DevOps * Математика * Облачные сервисы * Машинное обучение *

Аналитика

Из песочницы

Я ожидал, что прогнозирующий контроллер обгонит HPA на коротком пике. Но в Kubernetes всё упёрлось не только в алгоритм: пик длился 30 секунд, а новые Pod становились Ready примерно через 40.

Почему Pod не успевают

+1

net0pyr 3 июн в 09:01

AI inference на K8s: как выживать с LLM в кубере. DRA, GIE, LLM-D

Средний

9 мин

12K

Блог компании RUVDS.comKubernetes * Искусственный интеллектDevOps * Open source *

Обзор

Для многих обывателей, да и инженеров, которые не углублялись в тему, работа с LLM выглядит как работа с обычным сервисом: мы просто кидаем запросы по нужному endpoint и получаем JSON с ответом. Но на деле появляется много вопросов: как здесь работает кэш? От чего зависит время ответа? Что делать с огромным контекстным окном? И если у нас один GPU-сервер, на котором происходят все вычисления, то это не так и важно. Но что делать с масштабными распределёнными системами? Обычный Kubernetes не понимает, как устроен запрос языковой модели. Однако за последний год платформенные инженеры очень хорошо продвинулись в этом вопросе. И в этой статье я хочу подробно разобрать, как именно строится K8s-кластер под высоконагруженные LLM.

Читать далее

+31

levashove 3 июн в 08:01

Kubernetes Gateway API в 2026 году: сравниваем Envoy Gateway, Istio, Cilium, Kong и NGINX Gateway Fabric

13 мин

7.9K

Блог компании VK TechKubernetes * DevOps * IT-инфраструктура *

Перевод

Сейчас ландшафт сетей Kubernetes переживает самую значительную трансформацию со времен появления Ingress API в 2015 году. Gateway API прошел путь от бета-версии до General Availability и продолжает развиваться: к 2026 году — версия 1.4. Это фундаментальная переархитектура того, как трафик моделируется, управляется и защищается в Cloud-Native-окружениях. Это руководство — исчерпывающий анализ экосистемы вокруг этого стандарта: разбираем архитектурные подходы, характеристики производительности и наборы функций ведущих реализаций.

Наше исследование показывает: стандарт Gateway API успешно унифицировал базовый интерфейс конфигурации, заменив фрагментированную аннотационную модель Ingress, — но нижележащие реализации демонстрируют глубокие расхождения в производительности и операционном поведении.

Команда VK Cloud перевела статью для тех, кто уже несколько лет живет с зоопарком Ingress-аннотаций под NGINX, Traefik и ALB и сейчас выбирает, на что мигрировать. Автор разбирает Gateway API в его нынешнем состоянии (версия 1.4, GA), сравнивает пять Production-Ready-реализаций — Envoy Gateway, Istio в Ambient Mode, Cilium, Kong и NGINX Gateway Fabric — и дает фреймворк выбора под конкретный профиль нагрузки. Никакого маркетинга и «лучшего решения для всех»: цифры по Latency и CPU, архитектурные компромиссы, явные пределы масштабирования каждой модели.

Читать далее

+16

mishinaka 2 июн в 17:39

Pull request открыл — стенд появился. Закрыл — исчез. Эфемерные окружения в kubernetes через FluxCD

Простой

5 мин

9.3K

Kubernetes * DevOps * Git * GitHub *

Туториал

Из песочницы

Когда несколько разработчиков хотят одновременно показать свои изменения — локальной разработки уже недостаточно. В статье разбираем, как автоматически поднимать изолированные окружения в Kubernetes по PR с лейблом и так же автоматически удалять их при закрытии.

Реализация построена на FluxCD с использованием директивы postBuild для шаблонизации манифестов через переменные. Каждое окружение получает собственный namespace, базу данных, TLS‑сертификат и уникальный URL — и всё это без ручного вмешательства. Разбираем структуру CI/CD пайплайна, слоёвую организацию GitOps‑репозитория и автообновление образов через ImagePolicy.

Читать далее

+9

ilia_peskovatskov 2 июн в 07:51

Зачем мигрировать с Istio Sidecar на Ambient, если у вас всё хорошо

9 мин

5.6K

Блог компании Альфа-БанкDevOps * Kubernetes * Системное администрирование *

Всем привет! С вами Песковацков Илья (@ilia_peskovatskov), лид DevOps-направления. Мы два года жили прекрасно с Istio Sidecar, решали свои проблемы, в частности, с метриками и безопасностью. Но просто спокойно работать любознательным инженерам скучно и мы решили посмотреть на новый режим Ambient. В статье расскажу, как мы прорабатывали, провели и с чем столкнулись в рамках миграции своих кластеров Istio с Sidecar режима на Ambient.

Вроде познакомились, тогда погнали.

Читать далее

+7

Neith 2 июн в 05:01

Почему уязвимости годами живут в инфраструктуре: честный разговор

Средний

8 мин

7.1K

*nix * IT-инфраструктура * IT-стандарты * Kubernetes * Информационная безопасность *

Интервью

Дмитрий Беляев, CISO, подкастер, человек, который устал читать красивые отчёты

Я провёл подкаст с двумя людьми, которых в нашем цеху представлять не нужно. Александр Леонов - тот самый, кого первым вспоминают, когда речь заходит об управлении уязвимостями в русскоязычном сообществе. И Рустам Гусейнов, основатель кооператива специалистов по ИБ “Раткоп”, один из немногих, кто умеет говорить о безопасности языком денег, а не чек-листов.

Разговор вышел неудобным. Таким и должен был.

Я попробовал пересказать главное - с сохранением всей грубоватой честности, которой в корпоративных докладах обычно не бывает.

Читать далее

0

badcasedaily1 1 июн в 11:05

Canary в Kubernetes с Argo Rollouts и Prometheus: автоматический анализ и откат

Средний

8 мин

6.6K

Блог компании OTUSKubernetes * Программирование * DevOps *

Туториал

Обычный Kubernetes Deployment умеет заменить одну версию приложения другой, но почти ничего не знает о том, как новая версия ведёт себя под реальным трафиком. Контейнер может быть живым, readiness-проба — зелёной, а error rate или latency уже уезжают в красную зону.

В статье разберём, как собрать canary-деплой с Argo Rollouts и Prometheus: настроить пошаговый выкат, подключить AnalysisTemplate, автоматически откатываться по метрикам и не перепутать replica-based canary с настоящим traffic split через ingress или service mesh.

Читать туториал

+3

AUE0VE8 1 июн в 10:45

Не теряй навыков общения работая на удалёнке или Python + Психология

Средний

11 мин

5.5K

Python * Kubernetes *

Кейс

Из песочницы

В данной статье рассматривается создание приложения для тренировки общения. Реализация на Python с использованием k8s, linux, Redis, Postgres, kafka. Предлагаются варианты переиспользования созданных микросервисов.

Читать далее

0

GRADDATA 1 июн в 10:38

Как строить отказоустойчивые кластеры Kubernetes: краткий разбор от команды VK Cloud

Простой

8 мин

7.9K

Блог компании VK TechБлог компании VKKubernetes * DevOps * IT-инфраструктура *

Обзор

Миграция в облако и переход к микросервисной архитектуре сделали Kubernetes (k8s) де-факто стандартом для управления контейнерами. По данным 2025 года, технологию уже применяют 60% крупных российских компаний, а ещё 15% планируют внедрение в будущем. Причем 59% компаний называют отказоустойчивость ключевым критерием при выборе Kubernetes, но лишь единицы реализуют его на практике. Проблема кроется в недооценке системных рисков — от отсутствия резервирования control plane до некорректных таймингов readiness-проб, пропускающих «полуживые» поды в балансировщик.

В этой статье мы кратко разберем ключевые принципы проектирования и эксплуатации отказоустойчивых кластеров, типовые сценарии сбоев и рекомендации по исключению рисков на всех уровнях.

Читать далее

+13

nabokihms 1 июн в 08:18

Контроль целостности трёх «К» в Kubernetes: как не доставить в прод вредоносный код

Средний

19 мин

7.5K

Блог компании ФлантKubernetes * Информационная безопасность * IT-инфраструктура * DevOps *

Кейс

Между сборкой контейнера в CI и его запуском на узле есть длинная цепочка, в которой злоумышленники могут что-то подменить. Образ в registry, слои на диске, конфигурация в etcd, бинарники рантайма — каждый участок требует своей защиты.

Рассказываем, как мы реализовали сквозной контроль целостности в Deckhouse Kubernetes Platform: что доработали в containerd и kube-apiserver, как подписываем ELF-файлы и почему выпадение любого звена ломает всю систему. Если вы строите свой контур доверия, в статье есть Open Source-альтернативы для старта.

Читать далее

+10

casssuzy 31 мая в 13:08

Best Practices по Dockerfile: от базового образа и кеша до SBOM, Cosign и CI/CD

Средний

30 мин

17K

DevOps * Системное администрирование * Информационная безопасность * Kubernetes * Linux *

Туториал

Статья получилась большой: практик много, и каждая из них важна по-своему. Я собрал её как набор best practices: не все пункты нужны каждому проекту, но почти каждый пункт однажды всплывает на ревью, в CI или после неприятного инцидента.

Я старался писать для разных грейдов: от базовых ошибок вроде COPY . ., latest и root-пользователя до продовых тем вроде BuildKit, секретов, SBOM, подписи образов и защиты цепочки поставки ПО.
Поэтому язык подачи здесь намеренно сухой, прямой и инженерный: без долгих заходов, без воды и без пересказа документации ради пересказа. Я хотел сделать не обзорную статью, а рабочую памятку, к которой можно вернуться при написании, ревью или доработке Dockerfile.

Чтобы в статье было легче ориентироваться, я разбил её на смысловые блоки. Ниже оглавление: нажали на нужный пункт — сразу перешли к соответствующему разделу.

Оглавление:

1. Базовый образ, версии и управляемое обновление

2. Контекст сборки, .dockerignore, копирование файлов и безопасное получение внешних данных ...

Читать далее

+42

ConstantinT 29 мая в 16:59

# Bare-metal Kubernetes на 5 VM: Calico IPIP + MetalLB + GitOps — честный опыт с граблями

Средний

7 мин

11K

DevOps * Kubernetes * Системное администрирование *

Туториал

Из песочницы

Поднял Kubernetes кластер на 5 VM с нуля на VMware: Calico IPIP, MetalLB, GitOps через ArgoCD, PostgreSQL HA. Три неочевидные проблемы которые съели много времени — MTU и TLS, нестабильный BGP на VMware, конфликты git push в GitOps.

Читать далее

+6

Alex_StarRocks 29 мая в 14:46

Автоскейлинг StarRocks в Kubernetes: как я довел его до предела

Простой

7 мин

7.2K

Хранение данных * Базы данных * Kubernetes * DevOps * Высоконагруженные системы *

Кейс

Классическая проблема аналитических систем: кластер СУБД сайзится под пик, а 28 дней в месяц он задействован чуть больше чем наполовину. StarRocks (shared-data) и автоскейл Kubernetes убирают этот избыток. Compute добавляется под нагрузку и сворачивается на спаде. Внутри легкая пятничная статья: как это работает и где у эластичности потолок.

Читать далее

0

levashove 29 мая в 08:01

Cilium и защита CI/CD: как опенсорс-проект уровня ядра Kubernetes защищает свою цепочку поставок

21 мин

6.8K

Блог компании VK TechИнформационная безопасность * DevOps * Серверное администрирование * Kubernetes *

Обзор

Перевод

Cilium работает в сетевом пути уровня ядра в миллионах Kubernetes-pod'ов: от облачных провайдеров до собственных кластеров банков и телекомов. Если бы кто-то скомпрометировал сборочный пайплайн Cilium, зона поражения была бы сопоставима с инцидентом SolarWinds, но в облачно-нативной экосистеме. Поэтому подход проекта к безопасности CI/CD интересен не только мейнтейнерам других опенсорс-проектов: те же паттерны полезны любой команде, которая собирает прод-артефакты в GitHub Actions. Команда VK Cloud перевела статью с конкретными YAML-конфигами, дизайн-решениями и честным списком того, что у Cilium пока не сделано.

Читать далее

+14

1

2 3 ...