Cloud Load Balancing
Le load balancing, ou répartition de charge, est une technologie conçue pour distribuer la charge de travail entre différents serveurs ou autres ressources informatiques, afin d'optimiser la performance globale de l’infrastructure, son rendement et sa capacité. Le load balancer est réalisé par un équipement dédié, une appliance physique ou virtuelle. Cette appliance identifie en temps réel quel serveur au sein d'un pool répond le mieux à une demande donnée du client, tout en veillant à ce qu'un trafic réseau intense ne surcharge pas trop un seul et même serveur.
En plus de maximiser les capacités et les performances du réseau, la répartition de charge apporte une fonctionnalité de basculement (failover). Si un serveur dysfonctionne, un load balancer redirige immédiatement ses charges de travail vers un serveur de secours, atténuant ainsi les conséquences de la panne sur les utilisateurs.
Fonctionnement du load balancing
Les répartiteurs de charge traitent des demandes provenant d'utilisateurs qui sollicitent des informations ou d'autres services. Ils sont installés entre les serveurs qui gèrent ces demandes et Internet. Une fois la demande reçue, le répartiteur de charge détermine d'abord quel serveur d'un pool est disponible et en ligne, puis achemine la demande vers ce serveur. Sur les périodes de forte charge réseau, un load balancer peut ajouter dynamiquement des serveurs pour répondre aux pics de trafic. A l'inverse, il peut libérer des serveurs si la demande est trop faible.