Dimanche, les utilisateurs étrangers ont dû faire face à un problÚme prolongé coupure électrique qui impliquait divers services Google: de YouTube à Drive, jusqu'à Gmail. Une alarme est revenue en quelques heures. Aujourd'hui, le groupe Mountain View revient sur l'histoire, expliquant les raisons qui ont causé le dysfonctionnement, son impact et les mesures mises en place pour éviter qu'il ne se reproduise.
Black-out de Google : la cause
Le message partagĂ© par bigG sur le blog officiel parle de retards qui ont affectĂ© le moteur de recherche et d'erreurs gĂ©nĂ©rĂ©es par certaines des plates-formes gĂ©rĂ©es. LĂ causer se retrouve dans la modification apportĂ©e au configuration de certains serveurs: au lieu d'ĂȘtre appliquĂ© Ă un petit nombre de machines situĂ©es dans une seule rĂ©gion, il a Ă©tĂ© introduit Ă plus grande Ă©chelle, rĂ©duisant de plus de moitiĂ© la capacitĂ© de gĂ©rer le trafic entrant et sortant de plusieurs centres de donnĂ©es. L'infrastructure qui restait opĂ©rationnelle s'est ainsi retrouvĂ©e devant faire face Ă un nombre inattendu de demandes, gĂ©nĂ©rant des congestions et par consĂ©quent les ralentissements subis.
Il arrivait que les serveurs priorisent les requĂȘtes les moins gourmandes en bande passante. Google l'explique par une comparaison : c'est comme s'il avait continuĂ© Ă livrer les colis les plus urgents Ă vĂ©lo, le long de routes bloquĂ©es par un embouteillage. Les ingĂ©nieurs de Mountain View ont identifiĂ© l'anomalie en quelques secondes, tandis que le diagnostic du problĂšme et ses correction ils ont pris quelques minutes, rĂ©tablissant une situation normale quelques heures plus tard. Le mĂȘme ralentissement qui a affectĂ© les utilisateurs a Ă©galement ralenti l'intervention des techniciens.
Pendant la panne, les Ă©crans de YouTube a diminuĂ© d'environ 10 % Ă l'Ă©chelle mondiale, tandis que le trafic sur services de cloud pour le stockage, il a diminuĂ© de 30%. Pourtant, environ 1% des utilisateurs Gmail a rencontrĂ© une sorte de dysfonctionnement : une petite part, mais cela compte tenu de l'adoption de la plateforme dans le monde se traduit par des millions de personnes incapables d'envoyer ou de recevoir des messages. Les Moteur de recherche au contraire, il n'a subi que des ralentissements dans la gestion des requĂȘtes.
L'article met en Ă©vidence la façon dont Google est encore au travail comprendre dans les moindres dĂ©tails la dynamique du problĂšme, ainsi que les raisons de l'attente prolongĂ©e pour que tout puisse revenir Ă la normale. La sociĂ©tĂ© s'engage Ă©galement Ă Ćuvrer pour que de tels incidents ne se reproduisent plus. Ceci est le commentaire de clĂŽture.
Nous savons que les gens du monde entier comptent sur les services de Google et, au fil des ans, se sont habitués à s'attendre à ce que tout fonctionne à tout moment. Nous prenons cette attente trÚs au sérieux : c'est notre mission, notre inspiration. Lorsque nous ne le satisfaisons pas, comme le dimanche, cela nous motive à apprendre le plus possible et à rendre nos services encore meilleurs, plus rapides et plus fiables.
Google explique les causes du black-out de dimanche