Mise à jour le 20 juillet à 8h30. Le travail effectué pour corriger le problème fonctionne, aucun blocage constaté après le 17 juillet. Nous fermons l'incident.
Mise à jour le 17 juillet à 10h18. L'ensemble des environnements s'est encore bloqué ce matin à 9h10 heure de Paris. La coupure a duré quelques minutes.
Hier nous avons compris d'ou venait le problème, un cumul d'opérations techniques engendre un blocage d'un groupe d'environnement et notre load balancer considère que l'ensemble de la plateforme est hors service, coupant ainsi l'accès à tous les utilisateurs. Nous mettons en place une solution pour que cela ne se reproduise pas demain matin.
Nous nous excusons pour la gène occasionnée.
Aujourd'hui entre 8h30 et 8h40 heure de Paris, l'ensemble des environnements s'est retrouvé inaccessible.
Un cluster de base de données s'est bloqué comme hier matin ce qui a déclenché un blocage complet au niveau du load balancer qui a considéré que l'ensemble des environnements étaient inaccessibles. Il semble que la fin de la sauvegarde cumulée avec plusieurs traitements ont provoqué ce blocage.
Nous cherchons une solution pour que cet incident ne se produise plus.