НОВОСТИ
Основное о сбое в работе крупнейших социальных сетей и онлайн-сервисов

Основное о сбое в работе крупнейших социальных сетей и онлайн-сервисов

Никогда такого не было, и вот опять — масштабный сбой произошел у Facebook Inc. Это «уложило» на несколько часов принадлежащие ей сети Facebook, Instagram и мессенджер WhatsApp.

Что случилось?

Сбой глобального масштаба в работе Facebook, WhatsApp, Instagram произошёл около 15:30 по Гринвичу 4 октября. Стали недоступны как мобильные приложения, так и сайты этих сервисов.

Портал Downdetector, мониторящий популярные web-ресурсы, сообщает, что больше всего проблем было с работой приложений этих сервисов — более 50% всех обращений. Много жалоб на работу сайтов соцсетей, еще часть — на отсутствие соединений с сервером.

Представители Facebook вынуждены были давать объяснения на ресурсе своего конкурента — на своей странице в Twitter, где сообщили, что знают о проблемах. «Мы работаем над тем, чтобы как можно быстрее вернуть все в норму, и приносим извинения за возможные неудобства». В Instagram пользователей просили проявить терпение. «Потерпите вместе с нами, мы работаем [над проблемой]», — говорится в официальном аккаунте Инстаграм в том же  Twitter. Официальных версий компания не публиковала. В своём Twitter, технический директор Facebook Майк Шрепфер сообщил, что сбои в работе платформ связаны с сетевыми проблемами. Не уточняя деталей.Источник The Wall Street Journal сообщает, что проблема также затронула внутренние коммуникации корпорации: у ее сотрудников не работали рабочие приложения, сервисы для организации встреч и др. Корреспондент The New York Times Шира Френкель сообщила, что у сотрудников Facebook не работали бейджи, что не позволяло им попасть в здание компании, чтобы оценить масштаб сбоя. СNBC уточняет, что для ИТ-гигантов это крупнейший сбой с 2008 года.

Какие ещё сервисы пострадали

Масса жалоб от пользователей была на сбои в работе Twitter, Telegram, TikTok, Snapchat и сервисов компаний Google и Amazon. По информации Downdetector, массовые жалобы на неполадки в их работе были примерно в то же время, что и на работу сервисов Facebook.

Но ни один из перечисленных сервисов не подтвердил масштабный сбой. «Сервера Telegram испытывают небольшие трудности из-за притока новых пользователей после сбоя работы WhatsApp» — сообщила компания в Twitter. В то же время в Telegram отметили, что «рады всем новым пользователям», которые переходят из WhatsApp. Дополнительную нагрузку на сервера в Telegram не считают критичной, сервера стали «немного теплыми», а количество новых регистраций резко возросло.

Ко всему, часть пользователей Facebook, Instagram и WhatsApp по ошибке начали массово жаловаться на мобильных операторов и провайдеров интернета, считая их виновниками сбоя. Сервис Downdetector фиксирует жалобы пользователей в Интернете напрямую, не проверяя достоверность информации. При этом сами операторы сообщали о стабильной работе сети.

Читайте также: Топовые провайдеры облачного хостинга в Украине.

Мнения и комментарии экспертов

 «КРОК Облачные сервисы» утверждает, что сбои в работе Facebook происходят регулярно, но, в отличие многих иных случаев, сейчас речь идет о глобальной аварии.

«В подтверждение этой версии говорит то, что ресурсы оказались недоступны для жителей самых разных регионов: от США и Аргентины до Европы и России. Кроме того, для каждого отдельного сервиса, как правило, используются обособленные вычислительные, телекоммуникационные инфраструктуры, так что в случае одного локального сбоя на программном или сетевом уровне остальные сервисы продолжают работать. Но в данном случае все сервисы «легли». Скорее всего, причина в самом ЦОД, на базе которого они работают», — пояснил руководитель группы сопровождения клиентов этой компании Ренат  Сайфутдинов.

В департаменте аудита информационной безопасности Infosecurity рассказали, что проблемы могут быть на разных уровнях, но сейчас они наблюдаются со стороны DNS — системы доменных имен. «Из 20 популярных DNS-серверов, только два нам выдали IP-адреса домена facebook.com. Простыми словами, это означает: когда пользователь вводит в адресной строке браузера имя сайта или запускает приложение на смартфоне, устройство просто не понимает, к какому серверу нужно подключаться. То же самое, что звонить контакту из телефонной книги, в котором стерт сам номер, а осталось только имя человека. «Почему это произошло, нужно разбираться. Это может быть и хакерская атака на корневые DNS-сервера, и сбой непосредственно в инфраструктуре самого Facebook», — отметил эксперт.

Схожее мнение высказывает независимый журналист-расследователь Брайан Кребс, автор бестселлера Spam Nation. Он считает, что-то внутри Facebook послужило причиной аннулирования ключевых цифровых записей, которые указывали компьютерам и другим устройствам, как найти нужный «пункт назначения» в Сети. Многие считают наиболее верной версию, описанную пользователем Reddit, по которой ресурсы Facebook и сама соцсеть стали недоступны из-за сбоя на инфраструктуре bgp-пиринга (протокола, который используется для соединения автономных систем). А сбой в самой инфраструктуре обусловлен ошибкой в настройках, «так как файл с настройками маршрутизатора, содержащий ошибку, был выкачен на сетевое оборудование Facebook перед аварией». «Инфраструктура bgp-пиринга отвечает за обмен информацией между маршрутизаторами, и сейчас маршрутизаторы Facebook не знают, куда пересылать сетевые IP-пакеты (набор данных, передаваемых в сети, куда входят запросы пользователей, IP-адреса отправителей и получателей и другая техническая информация)», — объясняет Технический директор REG.RU Александр Хакимов.

Читайте также: Недорогой хостинг — предложения и цены на хостинг.

Первый заместитель гендиректора RU-CENTER Андрей Кузьмичев соглашается с этой версией: «Это привело к тому, что сети внутри дата-центров оказались отрезанными от мира. К ним нельзя подключиться удаленно, чтобы исправить маршрутизацию, а инженеры в дата-центре не обладают нужной квалификацией».

«Сейчас уже официально подтверждено, что причина инцидента — изменение конфигурации магистральных маршрутизаторов, которые координируют сетевой трафик между центрами обработки данных Facebook. Нарушение сетевого трафика оказало каскадное влияние на способы связи с центрами обработки данных, в результате чего внешние и внутренние сетевые услуги были остановлены. Скорее всего это только следствие. Официальная версия причин возникновения глобального сбоя, возможно, призвана сместить фокус проблем на внутренние технические сложности компании, которые при этом довольно слабо объясняют недоступность других платформ, не связанных с Facebook», — комментирует IT-директор СберСервиса Сергей Бобров.

Эксперты одного из крупнейших в мире облачного провайдера Cloudflare, уже после начала восстановления работы сервисов начала, опубликовали отчет, где указали в качестве причины сбоя, произошедшего в сервисах Facebook, неправильно обновленные маршрутизаторы. Загруженное с ошибкой обновление привело к недоступности DNS-сервера Facebook. Проблемы с другими сервисами и приложениями в Cloudfare связали с возросшим количеством запросов пользователей. «DNS-сервера по всему миру были вынуждены обрабатывать в 30 раз больше запросов, чем обычно, это потенциально могло вызвать проблемы с задержкой и временем ожидания для других платформ».

/ 5. Всего голосов:

Facebook
VK
Google+
Twitter
LinkedIn

Больше новостей