Wszyscy, którzy korzystają z Google App Engine nie mieli wczoraj dnia, którego mogliby zaliczyć do udanego. Google App Engine odnotował najgorszą w historii awarię, która zmusiła pracowników z Mountain View do przejścia do trybu awaryjnego. O wszystkim na bieżąco informowali inżynierowie za pośrednictwem Twittera.
Google App Engine zaczął odnotowywać wyjątkowo wysoką latencję i poziom błędów, co doprowadziło do zawieszenia zapisów do datastore i memcache. Awaria odbiła się nie tylko na Google ale także wszystkich, którzy korzystali z usług Google App Engine, m.in. na Mike’u Pinkertonie(szefie programistów pracujących nad Google Chrome pod Macintosha), który podał na Twitterze, że awaria opóźni prace nad projektem.
Inżynierowie potrzebowali aż 8 godzin na doprowadzenie App Engine do stanu sprzed awarii. Google ujawniło, że problemem był system plików Google File System w jednym z centrum danych. Zwykle jeżeli występują takie problemy przełączany jest ruch na inne centra danych jednak w tym przypadku było to niemożliwe, ponieważ jak podaje Google “spowodowałoby to utratę spójności”.
Google dostało nauczkę i z pewnością już pracuje nad nowym, bardziej niezawodnym systemem dla App Engine. Przebieg wczorajszych wydarzeń można prześledzić na.