Ce weekend nous avons pu stabiliser la situation et l'ensemble des environnements fonctionne normalement maintenant.
Vendredi 21h15, nous coupons la plateforme de secours pour basculer sur un tout nouvel ensemble technique qui ne posera plus de soucis.
Mise à jour à 7h30 heure de Paris, malgré une réinstallation complète du cluster dans la nuit, le système est à nouveau tombé et nous avons rebasculé sur l'équipement de secours. Comme hier, supprimez le cookie de session si vous avez un message d'erreur disant que l'application est indisponible.
Mise à jour à 1h30 heure de Paris, nous avons remis en route le cluster de production. Nous avons pu également remonter la réplication VSDB.
Ce soir, à partir de 21h, nous couperons tous les environnements du groupe 7 pour revenir sur le cluster de base de données de production. Depuis 10h, le service VSDB du groupe 7 est toujours accessible mais n'est plus répliqué en temps réel. La réplication sera remise en route demain en matinée une fois que la plateforme de productions sera à nouveau opérationnelle.
Mise à jour à 10h25 heure de Paris, nous avons du basculer sur la plateforme de secours. Si vous n'arrivez pas à vous connecter, supprimez vos cookies sur l'adresse de votre environnement. Nous allons chercher une solution au problème de cluster de production. Une fois le problème résolu, nous devrons couper pendant la nuit tous les environnements du groupe 7 pour remettre en route la plateforme de production.
Mise à jour à 9h50 heure de Paris, le cluster est toujours instable dès que nous laissons des connexions passer. Nous tentons un dernier test et si ce n'est pas concluant nous engageons une basculer vers un système de secours.
A 8h20 heure de Paris, le cluster semble à nouveau être tombé, nous regardons ce qu'il se passe.
Mise à jour à 7h55 heure de Paris, le cluster de base de données a été intégralement redémarré et fonctionne normalement. La synchronisation de tous les noeuds était bloquée. Nous cherchons la cause.
Depuis 7h15 heure de Paris, les environnements du groupe 7 sont inaccessibles, nous cherchons la cause du problème.