Des infrastructures surpuissantes pour l'IA générative:
L'IA générative étant gourmande en ressources, AWS a présenté des solutions matérielles innovantes pour répondre à cette demande exponentielle. Au cœur de ces nouveautés :
Instances EC2 P6: Equipées des derniers GPU Nvidia Blackwell, ces instances offrent des performances 2,5 fois supérieures par GPU comparées aux P5, disponibles début 2025.
Trainium 2 et Trainium 2 Ultra: AWS dévoile sa nouvelle puce maison, Trainium 2, offrant 30% de puissance de calcul supplémentaire et plus de mémoire à haut débit à un coût inférieur. Le Trainium 2 Ultra, quant à lui, atteint plus de 83 pétaflops dans un seul nœud de calcul, démontrant une puissance de calcul multipliée par cinq par rapport aux infrastructures actuelles d'Anthropic (partenaire d'AWS). Le Trainium 3 est déjà en préparation pour début 2025.
Des outils logiciels intelligents et performants:
Au-delà du matériel, AWS a amélioré ses services logiciels pour optimiser l'utilisation de l'IA :
-
Amazon Bedrock: Ce service de construction et de déploiement d'applications d'IA générative se dote de la distillation de modèle, permettant d'exécuter des modèles plus petits et moins coûteux. La collaboration multi-agents, capable de coordonner des centaines d'agents spécialisés, a démontré son efficacité en réduisant le temps de génération de rapports complexes chez Moody's d'une semaine à une heure. Enfin, le raisonnement automatisé combat les "hallucinations" en vérifiant mathématiquement l'exactitude des réponses.
-
Amazon Q Developer: Cet assistant IA pour développeurs s'enrichit de nouvelles fonctionnalités pour automatiser la génération de tests unitaires, maintenir la documentation, identifier les vulnérabilités de sécurité, et même moderniser le code .NET vers .NET pour Linux (jusqu'à 4 fois plus vite et 40% de réduction des coûts de licence). Il facilite également la migration de VMware vers AWS EC2 et des mainframes, et se dote d'une capacité d'analyse des données pour la résolution d'incidents en temps réel.
-
Amazon SageMaker: Ce service, initialement dédié au Machine Learning, évolue vers une plateforme complète d'analyse de données. Un studio unifié permet d'accéder à toutes les données de l'entreprise, avec un système "zéro ETL" pour simplifier la connexion et un nouveau système "lake house" pour un accès facile aux données stockées dans différents endroits du cloud AWS.
Conclusion
Avec ces annonces, AWS confirme son engagement fort envers l'IA et positionne son cloud comme la plateforme idéale pour développer et déployer des applications d'IA générative. Les nouvelles capacités matérielles et logicielles offrent aux entreprises des outils puissants et performants pour tirer pleinement parti des avancées de l'intelligence artificielle. L'année 2025 s'annonce riche en innovations pour le cloud AWS, avec l'arrivée des instances P6 et Trainium 3.
Découvrez les derniers articles d'alter way
- kubevpn
- Kubernetes 1.32
- re:Invent 2024 : AWS mise tout sur l'IA pour son Cloud
- OVHcloud Summit 2024 : L’innovation au cœur d’un cloud souverain et performant
- Big Data & AI Paris 2024 : L'IA au cœur de toutes les transformations.
- Un retour vers l'open-source ? Vos outils DevOps préférés et leurs equivalents open-source.