В Петък вечер почти всички потребители, които използват услуги като Gmail, Google+, Hangouts, Calendar и Docs от Google, не бяха в състояние да получат достъп до тях за около 30 минути. Ето защо от Google излязоха с официално изявление, с което се извиняват на всички свои потребители за причиненото неудобство.
Проблемът бе решен и сега екипи на компанията са съсредоточени върху поправяне на грешката, която е предизвикала спирането, както и върху увеличаване на мониторинга, за да се гарантира, че този вид проблем няма да се случи отново.
Ето и какво се е случило във въпросната вечер:
Вътрешна система, която генерира конфигурации – по-същество, информация, с която се казва на другите системи как да се държат - се е натъкнала на софтуерен бъг и е генерирала неправилна конфигурация. През следващите 15 минути неправилната конфигурация е била изпратена към работещите в реално време услуги. Така „заявките“ на потребителите са били пренебрегнати, и тези услуги, от своя страна, са генерирали грешки.
Услугите отново работят нормално, а в момента от Google са съсредоточили над: (а) отстраняване на източника на недостатъчност, който е предизвикал прекъсването, и (б) ускоряване на времето за възстановяване, когато подобен проблем се случи отново
В следващите няколко дни ще бъдат предприети следните стъпки:
- Коригиране на грешката в генератора за конфигурации, за да се предотврати нов рецидив, и ще се извърши одит на всички други системи за критични конфигурации, за да се гарантира, че те не съдържат подобен бъг.
- Добавяне на допълнителни софтуерни проверки за потвърждаване входящи конфигурации, така че при ново генериране на лоши конфигурации, това да не доведе до нарушаване на работата на услугите зависещи от тях.
- Добавяне на допълнително целево наблюдение, за по-бързо откриване и диагностициране на причината за неизпълнение на услуга.
Проблемът наистина бе отстранен бързо и в Google определено работят усилено над предотвратяване на още такива случаи. Да се надяваме, че няма да бъдем засегнати отново, а ние можем да ви препоръчаме, никога да не разчитате само на една единствена услуга от една компания. Хубаво е винаги да имате план Б, когато се случи срив в системата й.
А знаете ли, какво всъщност се случва в тайната лаборатория на Google?