Le Game Day
Lors de cette édition du Game Day, 16 équipes, représentant les principales sociétés de consulting partenaires AWS et sponsors de l’AWS Summit Paris, se sont affrontées à l’occasion d’une compétition fun mais exigente.
Votre équipe de 3 personnes s’est vue confier la reprise du SI d’une startup fictive de location de licornes. Ce SI vous est laissé par une équipe qui, suite à des coupes budgétaires et quelques mois de moral au plus bas, a quitté le navire du jour au lendemain. Vous avez donc une infrastructure mal configurée qui doit vite revenir au top et servir le business des licornes !
Un scoreboard, constamment projeté en face des équipes, vous indique à la fois votre classement sur l’ensemble de l’épreuve, ainsi que votre évolution sur les dernières 15 secondes. Ce scoreboard est influencé par votre capacité à répondre au business, ce qui implique notamment d’avoir des services accessibles et rapides.
Un autre dashboard est accessible par chaque équipe afin de mieux comprendre son scoring : il montre notamment le détail des points gagnés ou perdus ainsi que la raison.
Une fois l’infrastructure remise à peu près d’aplomb, elle va subir les attaques des Chaos Monkey (que nous suspectons fortement être dans les locaux et avec un badge AWS autour du cou :-)). Ces gentils petits primates vont vous aider à tester votre capacité de réaction en simulant des pannes d’infrastructures classiques… Ainsi que des pannes moins classiques : on admettra que la startup a donné trop vite un accès au compte AWS à un stagiaire.
A 18:30, l’épreuve se termine avec l’équipe alter way en tête du tableau des scores ! Il est temps d’aller prendre un verre de décompression et discuter avec les confrères des autres équipes.
alter way Cloud Consulting remporte le Game Day
Notre équipe, composée de Aurélien Joga, Cecilia Di Maulo & Jérémy Mouton a remporté cette édition. Il s’agissait de la première participation de ces consultants au Game Day.
Debrieffing avec l’équipe
Edouard : La clef du succès pour obtenir un tel score a été de garder les services disponibles. Comment avez-vous fait pour être plus disponibles que les autres équipes ?
Aurélien : Après le début des attaques des Chaos Monkey, on a très vite réussi à mettre en place un “monitoring artisanal” : Jérémy a remarqué que AWS X-Ray fournit un outillage intéressant pour détecter les pannes. Cecilia a très vite pris l’habitude d’exploiter X-Ray et de troubleshooter en conséquence le service fautif.
Cecilia : On a aussi été une équipe très communicante ; dès que l’un d’entre nous constatait un problème, il le disait aux autres et cela permettait une première corrélation. Si tous les services tombent en même temps, alors il y a peut-être un problème sur le réseau du compte…
Edouard : Quels étaient ces problèmes ? Sont-ils ceux que nos clients/prospects peuvent rencontrer ?
Jérémy : Des simulation de pannes d’EC2, de mauvaises configurations de certains services… C’est assez réaliste ! Mais on ne va pas en dire plus pour ne pas ruiner le fun des prochains participants :-)
Edouard : Vous pouvez nous en dire plus sur les solutions apportées ?
Aurélien : Non, on ne peut pas parler de solutions spécifiques… Mais pensez par exemple à bien vérifier le routage (le niveau 3 existe toujours dans le cloud…). Certains problèmes avaient leur source dans le code même des applications. Le cycle de releases des startups étant très rapide, certaines applications nécessitent une analyse du code…
Edouard : Merci pour les pointeurs, vous comptez remettre votre titre en jeu participer au GameDay du prochain re:invent ?
Aurélien : Si on en a l’occasion, certainement !
Découvrez les derniers articles d'alter way
- kubevpn
- Kubernetes 1.32
- re:Invent 2024 : AWS mise tout sur l'IA pour son Cloud
- OVHcloud Summit 2024 : L’innovation au cœur d’un cloud souverain et performant
- Big Data & AI Paris 2024 : L'IA au cœur de toutes les transformations.
- Un retour vers l'open-source ? Vos outils DevOps préférés et leurs equivalents open-source.