Итак, причина исчезновения питания проста до банальности. Один из посетителей
вдавил кнопку аварийного отключения питания (наличие Большой Красной Кнопки возле каждого выхода из здания требуется согласно государственным стандартам пожарной безопасности США — так удобно работать пожарным), затем вернул ее в прежнее состояние, опустил защитный кожух на место и покинул здание.
Как говорит Фитцпатрик, он помнит случай, когда
Так или иначе, но почему потребовалось так много времени на восстановление системы? Здесь множество причин.
1. Материнские карты с глючными встроенными сетевыми картами, которые некорректно поддерживают функцию
2. Загрузка базы данных. Большинство машин восстановили свою
работу после появления электричества, меньше чем через час, но база
данных не была настроена на автоматическую загрузку резервной копии после сбоя. Раньше, если
сервере. Но когда они перезагрузились все вместе, то работающих БД не осталось, и базу пришлось запускать вручную.
3. Проверка данных. Конечно, можно было запустить все БД
и надеяться на лучшее, но инженеры решили сначала все проверить и перестраховаться.
резервные копии всех баз до их запуска. Перед загрузкой нужно было проверить целостность таблиц, которые хранятся в формате InnoDB, а также преобразовать некоторые таблицы из MyISAM в формат
InnoDB, чтобы проверить их тоже. На каждой машине в глобальном кластере прошло переиндексирование и проверка данных. Это заняло много времени.
4. Проблемы с дисковым кэшем. На серверах работали
5. Большинство
Последствия сбоя электропитания устранялись очень долго, поэтому сайт возобновил свою работу только сутки спустя.
Поскольку на серверах не использовалась синхронизация бинарного
журнала (binlogs) с жестким диском, некоторые транзакции, которые произошли на серверах непосредственно перед отключением питания, оказались безвозвратно потеряны. Администрация Livejournal извиняется перед пользователями, чьи записи оказались уничтожены.
Чтобы избежать таких проблем в будущем, планируется провести апгрейд материснких плат, подключить источники бесперебойного питания к другой сети, вручную отключить дисковое кэширование за
в файл GDBM, которая должна работать для всех пользователей в реальном режиме времени. Эта утилита позволит не только ускорить процесс восстановления, но и восстанавливать пользователей
в системе независимо друг от друга. Например, сначала платные аккаунты (таких всего 1,6% среди 5,8 млн пользователей), потом самых активных пользователей и т.д. Да и вообще, полезно поддерживать резервную копию в разных форматах.
Кроме того, говорит Фитцпатрик, уже закуплена куча дополнительных жестких дисков для бэкапа, так что Livejournal
основательно проапгрейдился. Подобного больше не должно повториться — честное слово.
www.webplanet.ru
10-клавишная мышь | Internet Explorer - шпионский модуль