Jeudi 22 octobre 2020 à 18 h 15 heure de Paris.
Nous avons redémarré le cluster de base de données du groupe 1.
Il y a eu une coupure globale de l'ensemble des environnements entre 17 h 15 et 17 h 20 qui était dû à un contrôle un peu trop fort de notre load balancer qui a considéré que tout était hors service à tort.
Le cluster du groupe 1 s'est bloqué à cause d'une surconsommation de mémoire sur un des nœuds. Ce nœud a dû être resynchronisé entièrement, car il n'est pas reparti après le redémarrage.
L'ensemble du groupe 1 était en fonctionnement à 18 h 15 heure de Paris.
La synchronisation du noeud en erreur s'est terminée à 21 h 15 heure de Paris.
Jeudi 22 octobre 2020 à 17h15 heure de Paris.
Le cluster de base de données des environnements du groupe 1 n'accepte plus les modifications.
Ce problème bloque complètement l'usage de ces environnements.
Nous cherchons l'origine du blocage.