OVH Community, votre nouvel espace communautaire.

VPS: stop and go


Adnane
02/05/2013, 11h27
Bonjour,

Afin de suivre l'évolution du thread, veuillez consulter la tache travaux
http://travaux.ovh.net/?do=details&id=8565

Cordialement
Adnane

Adnane
01/05/2013, 00h09
Bonjour,

Depuis quelques jours, nous avons des problèmes
de stabilité sur les VPS 2013 qu'on livre aux
nouveaux clients. Les VPS 2013 livrés il y a
quelques semaines n'ont aucun problème. Le
problème a apparu il y a 10J environ et chaque
jour devient de plus en plus important. On gère
en urgence de bugs liés au vCloud 5.1 et 1000v,
qui sont apparus seulement avec plusieurs milliers
de VPS en fonctionnement et de clients réels
qui font plein d'actions dans tous les sens.

Nous avons donc décidé de suspendre les ventes
de nouveaux VPS le temps de fixer ce problème.
On pense que ceci va nous prendre 7J-8J, c'est
à dire que la semaine prochaine mardi ou mercredi
on va reouvrir la commande et fournir à nouveau
de la qualité. Ça va sans dire que les clients qui
ont subit les pannes ce dernier jours ont le mois
gratuit.

Ainsi durant ces 7-8J, nous allons diviser
l'infrastructure de VPS en plusieurs petits
infrastructures. Ça sera fait demain matin. Ceci
provoquera une coupure dans le service entre
60-180 secondes par VPS. Pour les nouvelles
commandes, nous allons utiliser cette nouvelle
taille maximale d'une infrastructure (les données
de constructeurs sont .. fausses). En suite,
nous allons recoder tous les robots et l'API pour
utiliser directement vSphere au lieu de vCloud.
On va prendre 2-3J pour faire ça à 9 personnes.
Puis on se donnera 2-3J de test du manager/api
et les opérations courantes (réinstalle, snap).
Et donc cela nous amène à mercredi prochain où
on n'entendra plus parler de problèmes de VPS.
Durant ces travaux, il est fort possible que
le manager/api aient quelques problèmes/erreurs
inhabituels. C'est normal: on le recode.

On n'a pas l'habitude de prendre de décision
aussi radicales que fermer la commande mais l'idée
est de mettre toutes les ressources sur ce
problème. Gérer en plus le flux (important)
de nouvelles commandes ne nous permettrait pas
d'aller vite en revoyant toute l'infra comme
nous allons faire.

Désolé pour ces pannes.

Et au boulot. On a 8J max. C'est parti.

Amicalement
Octave