Abonnez-vous au flux d'information !
Tous les systèmes sont opérationnels

À propos du site

Cette page vous permet de suivre l'état de nos services VSActivity, VSExperience et VSPortage.

Incidents antérieurs

04/05/2022

Aucun incident signalé

03/05/2022

Aucun incident signalé

02/05/2022

Aucun incident signalé

01/05/2022

Aucun incident signalé

30/04/2022

Aucun incident signalé

29/04/2022

Aucun incident signalé

28/04/2022

Aucun incident signalé

27/04/2022

Aucun incident signalé

26/04/2022

Aucun incident signalé

25/04/2022

Aucun incident signalé

24/04/2022

Aucun incident signalé

23/04/2022

Aucun incident signalé

22/04/2022

VSActivity / VSPortage / VSExperience Les environnements du groupe 4 peuvent être indisponibles

À 15h50 heure de Paris,

Les données sont synchronisées, le cluster est au complet avec ces 3 nœuds. Le load balancer du groupe ne rencontre plus de difficulté à servir les demandes. Nous allons analyser la cause du problème au niveau du nœud qui subit un problème technique en début d'après-midi.

Nous allons également travailler à l'amélioration de la répartition de charge pendant une resynchronisation des données, un seul nœud pouvant accueillir correctement les demandes, l'autre étant occupé à fournir les données au nœud qui redémarre.

À 14h30 heure de Paris,

Nous avons réussi à forcer le trafic vers le noeud du cluster qui n'est pas occupé à effectuer la réplication, les environnements sont à nouveau accessibles normalement.

À 12h30 heure de Paris,

un des serveurs du cluster de base de données du groupe 4 a subi un problème de synchronisation de données. Nous avons déclenché une resynchronisation des données vers 13h50 heure de Paris, néanmoins nous observons des erreurs de connexion aléatoires depuis que nous avons lancé cette synchronisation.

Plus de la moitié des données a été synchronisée.

À la fin de la synchronisation, tout rentrera dans l'ordre.

Nous nous excusons pour la gêne occasionnée.

21/04/2022

Aucun incident signalé

20/04/2022

Aucun incident signalé

19/04/2022

Aucun incident signalé

18/04/2022

Aucun incident signalé

17/04/2022

Aucun incident signalé

16/04/2022

Aucun incident signalé

15/04/2022

Aucun incident signalé

14/04/2022

Aucun incident signalé

13/04/2022

Aucun incident signalé

12/04/2022

Aucun incident signalé

11/04/2022

Aucun incident signalé

10/04/2022

Aucun incident signalé

09/04/2022

Aucun incident signalé

08/04/2022

Aucun incident signalé

07/04/2022

VSActivity / VSPortage / VSExperience Nos 2 load balancers sont injoignables depuis l'extérieur

Le 08/04/2022 à 16h18 heure de Paris - Verbatim post incident

Bonjour, nous faisons un retour suite à l'incident d'hier pour vous détailler ce qu'il s'est passé et comment nous avons réussi à fournir un accès à nos clients.

Le 7 avril 2022 à 15h35 heure de Paris exactement, notre load balancer principal, le point d'entrée quand on utilise nos services, n'a plus reçu aucun trafic public (d'internet). Pour cette situation précise, nous avons une procédure, basculer les adresses IP vers un autre load balancer, celui de secours, qui attend sagement. Nous lançons la bascule, mais l'opération reste en statut "Mise à jour en cours", normalement, c'est une opération qui prend quelques dizaines de secondes, mais la au bout de 5 minutes, rien ne se passe. Les IP pointent toujours vers le load balancer principal qui n'est pas accessible.

Nous avions déjà ouvert un ticket à l'assistance Scaleway pour leur indiquer que notre load balancer était inaccessible depuis l'extérieur. Nous ouvrons un second ticket en mode urgent pour indiquer que la bascule de nos adresses IP flottantes, celle qui reçoivent tout le flux entrant de nos services, ne basculent pas. Réponse de l'assistance : nous avons un switch hors service dans la baie de votre load balancer principal et les bascules d'adresses IP flottantes sont bloquées tant que le switch ne sera pas remplacé, il va falloir être patient. Nous commençons donc à attendre, en espérant que le remplacement du switch aille vite.

A 16h30 toujours pas d'information sur l'incident chez Scaleway. Remplacer un switch, ça peut être long, au-delà de l'opération physique, il faut recharger la configuration et ce n'est pas forcément simple. Nous sentons que ça va être long. Nous décidons de monter un 3ème load balancer avec de nouvelles adresses IP pour nous services. Nous trouvons une stratégie pour modifier les enregistrements DNS en masse pour pointer vers les nouvelles adresses IP et à 17h, le nouveau load balancer commence a recevoir du trafic.

Nous avons donc appris que l'utilisation d'adresses ip flottantes pouvait être un point bloquant et nous intégrons dans nos procédures l'utilisation d'adresses IP de secours pour gérer ce genre de situation.

La bascule d'adresse IP est restée bloquée jusqu'à 22h30 heure de Paris et Scaleway a subi un autre problème de switch dans la nuit qui a paralysé cette fois-ci notre load balancer de secours. Nous sommes donc encore sur le load balancer monté hier spécialement pour cet incident. Nous prévoyons de basculer sur le load balancer principal ce week-end et nous gardons ce troisième load balancer en cas d'incident similaire.

Le 07/04/2022 à 17h heure de Paris

Mise à jour à 17h heure de Paris. Les équipes de Scaleway sont sur le problème. Nous avons décidé de mettre en route un troisième load balancer qui n'est pas impacté par le problème réseau de Scaleway. Le DNS est en cours de mise à jour.

Le 07/04/2022 à 13h35 heure de Paris

Bonjour,

Depuis 15h35 heure de Paris, nos 2 load balancers sont injoignables depuis internet. Toute la plateforme VSA / VSP / VSE est fonctionnelle au travers de nos réseaux privés, mais inaccessible depuis l'extérieur. Nous nous rapprochons actuellement de notre hébergeur pour savoir ce qu'il en est.

06/04/2022

Aucun incident signalé

05/04/2022

Aucun incident signalé