Clustering
Cours : Clustering. Recherche parmi 300 000+ dissertationsPar dissertation • 15 Avril 2013 • Cours • 1 627 Mots (7 Pages) • 875 Vues
1. Presentation general du clustering
1.1. Description
On parle de grappe de serveurs1 ou de ferme de calcul (computer cluster en anglais) pour désigner des techniques consistant à regrouper plusieurs ordinateurs indépendants (appelés nœuds, node en anglais), afin de permettre une gestion globale et de dépasser les limitations d'un ordinateur pour :
• augmenter la disponibilité ;
• faciliter la montée en charge ;
• permettre une répartition de la charge ;
• faciliter la gestion des ressources (processeur, mémoire vive, disques dur, bande passante réseau).
Les grappes de serveurs sont un procédé peu coûteux, résidant dans la mise en place de plusieurs ordinateurs en réseau qui vont apparaître comme un seul ordinateur ayant plus de capacités (plus puissant, etc.), très utilisé pour les calculs parallèles. Cet usage optimisé des ressources permet la répartition des traitements sur les différents nœuds.
Un des principaux avantages est qu'il n'est plus nécessaire d'acheter un serveur multiprocesseur coûteux et qu'il est souvent possible de se contenter de petits systèmes que l'on peut connecter à la suite les uns aux autres selon l'évolution des besoins.
Le terme cluster exprime l'idée de grappe. La Délégation générale à la langue française et aux langues de France préconise d'ailleurs l'emploi du terme « grappe ». Une grappe de serveurs est donc un groupe de serveurs indépendants fonctionnant comme un seul et même système. Un client dialogue avec un cluster comme s'il s'agissait d'une machine unique.
Dans les domaines scientifiques, les clusters sont habituellement constitués de nœuds de calcul, de nœuds de stockage et de un ou plusieurs nœuds frontaux. Il y a quelques fois des nœuds supplémentaires dédiés au suivi (monitoring).
Les nœuds peuvent être reliés entre eux par plusieurs réseaux. Communément, le réseau avec le débit le plus lent est dédié aux tâches d'administration (chargement des systèmes sur les nœuds, suivi, mesure de charge ...). À ce premier réseau vient généralement s'adjoindre un second réseau, avec une bande passante beaucoup plus importante. Ce réseau peut utiliser des technologies de type Quadrics, Myrinet ou Infiniband. Ces débits peuvent atteindre 40 Gigabit/s.
Les programmes exécutés sur ce genre de machine se servent d'une API standard Message Passing Interface, utilisant la communication entre les divers processus répartis sur les nœuds avec des messages.
Lors de la défaillance d'un serveur, le logiciel de clustering réagit en isolant le système défaillant. De même pour le partage des tâches d'un serveur surchargé avec un autre (dans le cas ou les ressources sont partagées entre plusieurs tâches).
Leur utilisation est de plus en plus importante dans la communauté scientifique, où les besoins en calculs à haute performance (HPC) sont toujours croissants, ainsi qu'en imagerie numérique notamment pour les images de synthèse au travers des fermes de rendu.
En Informatique de gestion, les clusters peuvent être utilisés pour minimiser l'impact d'une panne de serveur sur la disponibilité d'une application. Cela nécessite la mise en œuvre de disques partagés, par exemple dans le cadre d'un réseau de stockage SAN.
Dans d'autres domaines, on a de plus en plus recours aux réseaux pair à pair (P2P) comme alternative aux grappes de serveurs, et ce pour un coût moindre.
1.2. Quels intérêts ?
• Évolutivité
L’architecture en grappe vous permet de dimensionner votre système de manière
très flexible. Si votre système connaît des montées en charge croissantes, vous
pourrez y adjoindre de nouvelles instances du serveur d’application, parallèlement à
celles existantes, sans procéder à l’arrêt du système.
• Exploitation et configuration
L’administration centralisée d’une ferme de clusters simplifie les tâches d’exploitation et de configuration du système. Ces opérations peuvent être automatiquement propagées vers tous les nœuds du cluster, réduisant ainsi l’intervention humaine et le risque d’erreur.
Une instance de référence est d’abord définie puis ajoutée au cluster Une instance de référence est d abord définie puis ajoutée au cluster.
Elle constitue la base nécessaire à l’ajout d’autres instances qui hériteront de sa
configuration.
2. Presentation detaillé du clustering
un serveur est destiné à rendre un ou des services aux utilisateurs de l’entreprise. La messagerie, la gestion financière, l’hébergement de sites web ou de fichiers, etc., autant de services cruciaux pour l’entreprise. Et plus ces services sont cruciaux, plus les administrateurs souhaitent que le service soit disponible 24 heures sur 24, 7 jours sur 7. Pour cela, le service doit se
...