Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
DevOps — Методология разработки программного обеспечения / Хабр

Все потоки

DevOps *

Методология разработки программного обеспечения

368,87

Рейтинг

СтатьиПостыНовостиАвторыКомпании

Azamat_Safarov 1 час назад

Hermes Agent Desktop: личный опыт и пошаговая настройка под реальные задачи

Простой

9 мин

2.1K

Искусственный интеллектПрограммирование * Open source * DevOps *

Обзор

Я пользуюсь Hermes Agent уже месяц. Всё это время работал через командную строку (WSL) потому что на windows версии не было, Конечно, уже это довольно ощутимое ограничение, так как Hermes не имел полный выход к файлам в Windows, за это время свыкся с терминалом запускал через hermes chat. недавно вышла версия v0.15.2, и вместе с ней десктопный установщик на Electron. Windows, macOS, Linux.

Скачал, поставил, пошёл по настройкам. Оказалось, что в GUI тринадцать разделов, и каждый из них что-то решает. Ниже — гайд по тому, как можно оптимизировать настройки под себя.

Читать далее

+1

rakhanau 15 часов назад

CSR для SSL: разбор частых ошибок в SAN и wildcard

Средний

9 мин

8.3K

Информационная безопасность * Системное администрирование * DevOps * Веб-разработка *

Аналитика

Большинство проблем с SSL-сертификатами возникает не при настройке TLS, а на этапе создания CSR: забытые SAN-домены, неправильные ожидания от wildcard, ручные ошибки в openssl.cnf. Разбираем, почему с сокращением срока действия сертификатов до 47 дней к 2029 году ручной выпуск перестаёт быть жизнеспособным, и какие инструменты приходят ему на замену.

Читать далее

+1

cane 16 часов назад

Плагин для Docker для быстрого деплоя

Простой

3 мин

6.7K

DevOps * Go * Серверное администрирование * Open source *

Кейс

Перевод

Часть своих сервисов я держал в облаке, но когда счёт за AWS начал превышать ожидания, стало понятно: пора переносить их домой. Несколько месяцев назад я купил мини-ПК, но всё никак не находил времени его задействовать. Так я занялся решением проблемы локального деплоя.

Читать далее

+3

xcillx 18 часов назад

Сбой Yandex Cloud: стресс-тест в пятничный вечер

1 мин

6.2K

DevOps * Облачные сервисы * ХостингБазы данных *

Сегодняшний инцидент войдет в историю как интересный кейс «ошибки начисления». Чтобы спасти пользователей от некорректных списаний, облако просто заблокировало ресурсы (в моем случае, так как списалось слишком много).

Важный ворнинг: ваши виртуалки сами не поднимутся. Надо запустить после инцидента вручную.

Читать далее

+7

sergey_ist 20 часов назад

Простая сложная VictoriaMetrics

Средний

17 мин

6.2K

Блог компании KTSDevOps * Kubernetes *

Туториал

Привет, я Сергей Истомин, DevOps-инженер в KTS. А ниже моя история про построение мультитенантного скоупа кластеров VictoriaMetrics с разными периодами хранения метрик.

Статья будет о том, как собрать систему одновременно и простую, и сложную. Простую потому, что каждый поток данных в ней лаконичный и линейный, и сложную потому, что совокупности этих потоков комбинируются и интегрируются в общие компоненты. Система будет построена на редакции Community Edition.

Надеюсь, что я вас хорошенько запутал и при этом заинтриговал.

Читать далее

+13

Okker 20 часов назад

Fanotify — что он может дать по сравнению с inotify и что попросит взамен

Средний

23 мин

6.9K

Блог компании InfoWatchИнформационная безопасность * Системное администрирование * DevOps * Linux *

Обзор

Привет, Хабр! На связи Даниэль из InfoWatch, разработчик решений класса информационной безопасности. В предыдущей статье мы рассматривали задачу контроля целостности в среде Linux с помощью системного интерфейса inotify. Поговорили о ключевых недостатках, с которыми приходится сталкиваться в ходе работы с самим инструментом напрямую.

Наверное, многие из вас знают, что существует другой более совершенный и более функциональный системный интерфейс — fanotify. В рамках данной статьи мы продолжим рассматривать задачу мониторинга объектов файловой системы, но уже через призму fanotify. Попробуем ответить на вопросы, решает ли данный инструмент описанные ранее проблемы.

Введение

Начнём с краткой сводки по fanotify. fanotify представляет собой kernel-интерфейс, позволяющий мониторить события файловой системы в режиме реального времени. Определение такое же, как и для inotify. Почти. Существенная разница в том, что список обрабатываемых событий у fanotify гораздо шире, а также есть возможность принимать решение kernel-характера в user space. Простыми словами: вы можете разрешать/запрещать запуск программ без написания драйверов (модулей ядра), так как fanotify позволяет разрешить/запретить создание процесса в пользовательском пространстве.

Читать далее

+4

viciious 21 час назад

Непридуманная история о том, как мы перетащили 300 ТБ key-value данных в облако без простоя

Сложный

12 мин

7.8K

Блог компании VKОблачные сервисы * DevOps * IT-инфраструктура * Tarantool *

Кейс

Привет, Хабр! Меня зовут Виктор Лучиц, я архитектурный лид в отделе инфраструктурной разработки рекламных технологий VK. Я расскажу, как наша команда осуществила конвергенцию двух наших core-технологий, как справлялись с инцидентами и что в итоге получили.

Это не столько рассказ о самих технологиях, сколько попытка частичной систематизации нашего опыта работы со сложными системами. Этим опытом нам хотелось бы поделиться с читателями Хабра, и надеемся, что он покажется вам полезным.

Приступим к конвергенции

+9

Aidaho12 21 час назад

IncidentRelay: self-hosted on-call, alert routing и уведомления без SaaS и канадских номеров

Простой

3 мин

6.5K

Системное администрирование * DevOps *

Обзор

Привет, Habr!

Мы разрабатываем IncidentRelay - self-hosted систему для on-call scheduling, маршрутизации алертов и доставки уведомлений. Идея простая: дать командам SRE, DevOps, platform и operations понятный инструмент, который можно развернуть у себя, подключить к мониторингу и использовать без зависимости от внешней incident-management платформы.

Читать далее

+3

sproshchaev 22 часа назад

Основы Ansible — как автоматизировать конфигурации и деплой

Средний

7 мин

6.5K

Блог компании OTUSDevOps * IT-инфраструктура * Системное администрирование *

Туториал

В статье — разбор основ Ansible: как писать идемпотентные плейбуки, не класть продакшен сухими прогонами и встроить Ansible в CI/CD.

Разбираю структуру ролей, работу с динамическим инвентарём, секретами и типовые грабли новичков. Две наглядные схемы, реальный кейс из боевой практики и набор правил, которые делают автоматизацию предсказуемой и безопасной.

Читать разбор

+3

opium 22 часа назад

MCP-серверы для Claude Code: как подключить Telegram, базы данных и всё что угодно

Средний

4 мин

9.3K

Искусственный интеллектPython * DevOps *

Туториал

Когда я начал пользоваться Claude Code, у меня было ощущение, что я дал умному человеку доступ только к одной папке на компьютере. Он видит код, помогает с задачами — но не знает, что происходит снаружи. Нет доступа к чатам, к базе данных, к GitHub issues. Всё это приходилось копировать руками и вставлять в контекст.

Потом я узнал про MCP.

Читать далее

+7

Geri4 23 часа назад

Как собрать своё зеркало PyPI на nginx за вечер (и не зависеть от блокировок pypi.org)

Средний

4 мин

5.6K

Python * DevOps *

Туториал

Из песочницы

Вчера pypi.org несколько часов был недоступен из российских сетей. Для кого-то это «подождём», а для CI/CD, прода и просто рабочего дня — это вставший pip install и красные сборки.

Причина системная: pypi.org и хранилище пакетов files.pythonhosted.org живут на CDN Fastly, у которого нет точек присутствия в России и доступ к которому уже не раз ограничивался. Вчерашняя недоступность — не первая и почти наверняка не последняя.

Хорошая новость: чтобы застраховаться, не нужно зеркалировать весь PyPI (это терабайты и постоянная синхронизация). Достаточно поднять лёгкий реверс-прокси на nginx. В этом гайде соберём такой с нуля — с кешированием и прозрачным переключением для pip.

Не хотите хостить сами? Есть уже готовое зеркало — pypi.depkit.ru. Оно работает на российских IP, имеет большой объём кеша под пакеты и отдаёт их очень быстро. Можно просто подставить его в index-url (как — в конце статьи) и пропустить всю настройку. Дальше — для тех, кому интересно поднять своё.

Читать далее

+6

kubelet вчера в 08:25

Загадка ядра Linux: почему на 36 vCPU Cilium падает, а на 32 — нет

Средний

12 мин

7.3K

Блог компании ФлантDevOps * Kubernetes * Linux *

Кейс

Перевод

На кону финансовые данные клиентов, а странный и неуловимый баг в Cilium не даёт как следует настроить сетевую безопасность.

Статья о том, почему любая «нерешаемая» проблема — это «пока недостаточно изученная» проблема. От случайных догадок — к системному исследованию и пул-реквесту с фиксом прямо в Linux.

Читать далее

+13

levashove вчера в 08:21

Что kubectl debug вам не показывает: незаметный пробел в данных

7 мин

6.7K

Блог компании VK TechKubernetes * Системное администрирование * IT-инфраструктура * DevOps *

Перевод

Команда VK Cloud перевела статью для тех, кто разбирает инциденты в Kubernetes с помощью kubectl debug. Автор разбирает незаметный пробел в данных: после завершения debug-сессии API Kubernetes не сохраняет контекст ее завершения — код возврата, длительность сессии и целевой контейнер исчезают при первом же изменении состояния пода. В статье как воспроизвести это тремя командами, почему так устроено на уровне спецификации API, чем это грозит при разборе инцидентов и комплаенсе и что можно сделать уже сегодня.

Читать далее

+14

chisi вчера в 08:00

Как я сделал локальный RAG-сервис для SRE: ищем по документации, ранбукам и коду через Ollama

Средний

6 мин

5.7K

Python * Искусственный интеллектDevOps *

Туториал

Из песочницы

Недавно делал учебный проект про автоматизацию документирования инцидентов. Поначалу планы были грандиозными: инциденты, таймлайны, интеграции с мониторингами, чатами, постмортемы, подсказки дежурным инженерам.

Но довольно быстро стало понятно, что с временными и ресурсными ограничениями лучше не пытаться написать маленький PagerDuty. Поэтому я сузил задачу до более реалистичного ядра: локального RAG-сервиса, который ищет по документации, ранбукам и коду, а затем передаёт найденный контекст в LLM.

Так появился llmortem — FastAPI-сервис, который можно подключить к OpenWebUI как OpenAI-compatible backend.

В статье расскажу, как устроена архитектура, почему я начал с BM25, зачем индексировать docstring’и и какие ограничения у такого подхода.

Читать далее

+1

dkhimion 4 июн в 13:57

SLA как инструмент, а не отчёт

Средний

16 мин

7.7K

Блог компании X5 TechDevOps * IT-инфраструктура * Визуализация данных * Управление разработкой *

Аналитика

Это вторая часть разбора того, как мы выстраивали SLA и инцидент-менеджмент в большом продукте.

В этой части речь пойдёт о следующем этапе — масштабировании и удешевлении. О том, что происходит, когда SLA считается корректно, цифрам уже доверяют, но компания продолжает развиваться. У неё кратно растёт количество разработчиков, архитектура усложняется и количество сбоев тоже растёт. Инциденты и сбои это наши обиходные синонимы и по ITIL это не одно и тоже, уж простите. С ростом ограничением становится не математика и перегибы полиномов высоких порядков, а люди, ручной труд, коммуникации и скорость реакции. О том, что со всем этим делать и поговорим.

Читать далее

+6

dbraincloud 4 июн в 13:25

VictoriaLogs vs Loki vs Elasticsearch

Средний

5 мин

8.2K

Блог компании dBrainKubernetes * Микросервисы * IT-инфраструктура * DevOps *

Кейс

Привет, Хабр! В этой статье разбираем плюсы и минусы VictoriaLogs как решения для логирования в облачной платформе.

Читать далее

+4

SimpleOne_it 4 июн в 11:56

Как выбрать систему для разработки и пожалеть через полгода

Простой

8 мин

9.6K

Блог компании SimpleOneУправление разработкой * Управление проектами * DevOps *

Мнение

На демо всё красиво: задачки бегают, доски сияют, отчёты рисуются. Через полгода команда уточняет статусы в чате, релизы сверяет в таблице, а тимлид перед стендапом открывает пять вкладок. Разбираем четыре ошибки выбора системы управления разработкой и даём чеклист из 12 вопросов, которые стоит задать до покупки.

Читать далее

+3

WH_Rain 4 июн в 09:40

От Prometheus к Victoria Metrics: как мы пересобрали мониторинг в Kubernetes

Сложный

14 мин

8.4K

Блог компании NavioKubernetes * DevOps *

Кейс

1. Введение

Всем привет! Меня зовут Яблоков Олег, я — ведущий инженер ИТ-отдела Navio и отвечаю за систему мониторинга основной инфраструктуры компании. Это работа на стыке разработки и эксплуатации (development & operations, DevOps), наблюдаемости (Observability) и обеспечения надёжности сервисов (Site Reliability Engineering, SRE). Моя основная задача не просто собирать метрики, а сделать так, чтобы по ним можно было быстро понять статусы сервисов и не утонуть в шуме оповещений.

Когда я пришел в компанию около года назад, система мониторинга уже существовала и закрывала базовые задачи. В наборе технологий использовались Prometheus, Thanos, Alertmanager, Grafana, Elasticsearch и различные наборы оповещений. Со временем количество компонентов и инструментов увеличилось, что усложнило их сопровождение и масштабирование.

В этой статье я расскажу, как происходила миграция мониторинга в Kubernetes, почему в качестве основной базой данных временных рядов (Time Series Database, TSDB) была выбрана Victoria Metrics, как мониторинг связали с Gitlab и Argo CD, пересобрали систему оповещений (alerting) и начали постепенно двигаться от инфраструктурного мониторинга к сервисному подходу и практикам обеспечения надёжности сервисов (Site Reliability Engineering, SRE).

2. С чего все начиналось.

Изначально мониторинг представлял собой связку Prometheus, Thanos, Alertmanager, Grafana и Elasticsearch. Разворачивалось все через Docker Compose на отдельных серверах, а сама система постепенно росла вместе с инфраструктурой.

Читать далее

+7

enamored_poc 4 июн в 09:40

Что у вас спросят про Docker на интервью? Разбираем 10 главных вопросов

Простой

11 мин

17K

DevOps * Карьера в IT-индустрииСистемное администрирование * IT-инфраструктура * Учебный процесс в IT

Обзор

Docker уже давно перестал быть «модной новинкой» и превратился в минимум для любого бэкендера, DevOps-инженера или QA. Строчка с Docker есть почти в каждом резюме, поэтому на собеседованиях технические специалисты любят копать глубже.

Вызубрить десяток флагов для docker run — недостаточно. Интервьюеры хотят видеть, что вы понимаете саму архитектуру контейнеризации: как работает изоляция процессов, почему данные внезапно исчезают после рестарта, чем слои отличаются от томов и что будет, если PID 1 внутри контейнера завершит работу.

Читать далее

+20

kishmishl 4 июн в 09:29

Может ли Service сломать ваш K8s кластер?

Средний

37 мин

7.4K

Блог компании VK TechБлог компании VKKubernetes * DevOps * Информационная безопасность *

Привет, Хабр! Меня зовут Михаил, я backend-разработчик в команде Managed Kubernetes в VK Cloud. При работе с K8s всем нам приходится сталкиваться с множеством конфигураций, которые мы используем постоянно, и Service не является исключением. И вот тут мне стало любопытно: а может ли с виду безобидный конфиг Service сломать нам весь кластер? Ну или хотя бы подпортить жизнь какому-то сервису?

Зачем мне это? Во-первых, это просто интересно: сломать что-то, понять, как оно работает, узнать, как то, что кажется обыденностью, может стать проблемой. Во-вторых, если удастся что-то накопать, то мы получим список потенциальных ошибок нашего кластера и будем думать над способами защиты и обнаружения. Так что приступим!

Статья будет полезна DevOps, безопасникам, админам и просто юным любителям Kubernetes.

Читать далее

+21

1

2 3 ...