DEVOPSITSEC Telegram 1408
🔎 Когда падает дата-центр: кейс Яндекса и что с этим делать

30 марта в одном из дата-центров Яндекса произошло полное отключение электропитания. Инцидент затронул Яндекс Облако и вызвал сбои в работе ряда сервисов и клиентов.

Что важно понимать: у Яндекс Облака три зоны доступности. Пользователи сами выбирают, в какой зоне размещать свои ресурсы: виртуальные машины, базы данных, кластеры и так далее. Обычно это позволяет распределить нагрузку и повысить отказоустойчивость, но бывают случаи, когда срабатывают крайне редкие сценарии, что и произошло в этот раз.

Что можно было сделать заранее?
Чтобы снизить риски в таких ситуациях, облачные провайдеры предлагают ряд инструментов. Основные подходы:
- Распределение нагрузки. Размещайте сервисы в разных зонах.
- Балансировщики. Они могут быть сетевыми (уровень 4 OSI) или прикладными (уровень 7)
- Контейнеризация и оркестрация. Kubernetes (особенно в managed-варианте) даёт мощные инструменты для отказоустойчивости
- Резервное копирование. В случае физических повреждений (пожары, затопления) это критически важно.

Надежность в облаке — не по умолчанию. Она строится за счёт архитектуры, автоматизации и здравого смысла.

🔗 Подробнее

@devopsitsec
3🔥3👎1🥰1



tgoop.com/DevOPSitsec/1408
Create:
Last Update:

🔎 Когда падает дата-центр: кейс Яндекса и что с этим делать

30 марта в одном из дата-центров Яндекса произошло полное отключение электропитания. Инцидент затронул Яндекс Облако и вызвал сбои в работе ряда сервисов и клиентов.

Что важно понимать: у Яндекс Облака три зоны доступности. Пользователи сами выбирают, в какой зоне размещать свои ресурсы: виртуальные машины, базы данных, кластеры и так далее. Обычно это позволяет распределить нагрузку и повысить отказоустойчивость, но бывают случаи, когда срабатывают крайне редкие сценарии, что и произошло в этот раз.

Что можно было сделать заранее?
Чтобы снизить риски в таких ситуациях, облачные провайдеры предлагают ряд инструментов. Основные подходы:
- Распределение нагрузки. Размещайте сервисы в разных зонах.
- Балансировщики. Они могут быть сетевыми (уровень 4 OSI) или прикладными (уровень 7)
- Контейнеризация и оркестрация. Kubernetes (особенно в managed-варианте) даёт мощные инструменты для отказоустойчивости
- Резервное копирование. В случае физических повреждений (пожары, затопления) это критически важно.

Надежность в облаке — не по умолчанию. Она строится за счёт архитектуры, автоматизации и здравого смысла.

🔗 Подробнее

@devopsitsec

BY DevOps


Share with your friend now:
tgoop.com/DevOPSitsec/1408

View MORE
Open in Telegram


Telegram News

Date: |

Hashtags A vandalised bank during the 2019 protest. File photo: May James/HKFP. ‘Ban’ on Telegram SUCK Channel Telegram Telegram Android app: Open the chats list, click the menu icon and select “New Channel.”
from us


Telegram DevOps
FROM American