Nouveaux Systèmes de stockage de données (SAN/NAS) Par : GOEBEL Georges georges@goebel.tv Plan Mise en contexte Storage Area Networks • Architecture Fibre Channel Network Attached Storage Exemple d’un serveur NAS • EMC2 Celerra Conclusion Démonstration Questions - Réponses Mise en contexte De nos jours la quantité des données augmente Comment garantir l’accès aux données 24h/24h et 7j/7j ? Grand centre de stockage • Solution propriétaire « Open System » • Architecture i386, SCSI, TCP/IP, … • Avant plusieurs années pas de solution dans l’immédiat Storage Area Network Caractéristiques : • • • • Augmenter la capacité de stockage des serveurs particuliers Accès multiples et directs aux mêmes données Séparation de lieu (serveur et sauvegarde) Intégration des solutions back up (tape libraries) Avantages : • Haute disponibilité des données • Redondance des données Storage Area Network Composé de : • Serveurs • Groupes de disques (Storage Array) • Fibre Channel Switch/Hub, SCSI, iSCSI, … Serveur • Rendre les données accessibles à l’extérieur • File System, Base de données, Vidéo, … Storage Array (SA) • Groupe de disques magnétiques en RAID (Redundant Array of Inexpensive Disks) Storage Array (SA) Chaque groupe est un RAID de disques ! Storage Array : RAID RAID 0 : Striping • 2 disques physiques-> visible 1 disque virtuel avec la capacité des 2 disques • Aucune protection contre un crash RAID 1 : Mirroring • La même information se trouve sur 2 disques différents • Bonne protection contre un crash d’un disque RAID 5 : • 3 disques données + 1 disque avec parité • Striping des 3 disques données • -> réduit le nombre des disques pour la même sécurité Autre : RAID S (parité distribué), RAID 7 (5 + 1) SAN : Connectivité Connexion entre Serveur et SA • • • • Parallèle (S/390 Mainframe) ESCON (Mainframe) SCSI (Open System) Fibre Channel (Open System) Avantage du « Open System » • Indépendance d’un fournisseur / marque • Plus de choix SCSI vs Fibre Channel Caractéristiques • SCSI : • Distance maximale : 19 – 25 m • Débit maximal : 20-40 MB / seconde • Protocole : SCSI (Small Computer System Interface) • Fibre Channel : • • • • Distance maximale : 300 – 500 m (10km – 60km) Débit maximal : 100 MB / seconde Protocole : SCSI encapsulé (frame based protocol) Possibilité d’utiliser d’autres services à travers le même fil (Vidéo, SCSI, réseau) Trouver un compromis • Prix Solution FC = 1.5 * Prix Solution SCSI • Mais : Fibre Channel est le futur SAN : Fibre Channel topologie Différentes connexions entre Serveur et SA possibles Point à Point • Bande passante et accès exclusif garantie (QoS garanti) • Comparable à SCSI SAN : Fibre Channel topology Fibre Channel Arbitrated Loop (FC-AL) • Daisy Chain • 127 nœuds au maximum • Bande passante complète mais accès partagé Désavantage : Single Point of Failure ! SAN : Fibre Channel topology Fibre Channel Hub • Comme Daisy Chain mais sans « Single Point of Failure » SAN : Fibre Channel topology Fibre Channel Switched Fabric (FC-SW) • Administration en un point central • No Single Point of failure • Chaque nœud gère une connexion point à point SAN : High Availability SAN : High Availability avec distance topologie Connexion entre les « Fabric Switch » • connexion « long wave » -> 10 km ( nouvelle technologie 60 km ) • Seulement possible entre switch, les nœuds ne le supportent pas connexion « long wave » SAN : Produits Sun • StoreEdge Series IBM • FAStT200 storage server, FAStT400 storage server, … EMC2 • EMC CLARiiON Midrange Storage Systems, … HP • Disk System 2100…2405, HP Surestore series, … Autres • Hitachi, Broadcom,… Network Attached Storage Network Attached Storage NAS HEAD : Groupement de machine(s) (cluster) offrant les données persistantes (SAN) à l’extérieur à travers le protocole TCP/IP Caractéristiques : • Haute disponibilité (High Availability) • Groupes redondantes de disques (redundant storage array) • Serveurs redondants (redundant server) • Redémarrage automatique et disponible endéans quelques minutes • Haute performance (High Performance) • Système d’exploitation optimisé I/O pour serveurs de fichiers • Connexion multiple entre Serveurs et SA (distribution de charge) • Cache sur SA Network Attached Storage Caractéristiques (suite): • Servir le plus grand nombre de requêtes en réseau simultanément • « Content on demand » • « Video on demand » • Supporter des « File system » multiples • CIFS (Common Internet File System) • NFS (Network File System) • Diminution des efforts d’administration • Gestion centralisée (bien sûr redondante) • Extensibilité (Scalability) • Utilisation des composants standards (PC, FC, …) Différence SAN et NAS SAN • Connexion • FC ou SCSI NAS • Connexion réseau • Ethernet, FDDI, ATM • Serveurs connectés avec FC peuvent accéder à SAN • Toute machine dans le réseau peut accéder à NAS • Protocole : Encapsulated SCSI • Protocole : TCP/IP, CIFS, HTTP • Peu de overhead 100 MB/sec • Next generation -> 200 MB/sec • Bloque I/O • 10 km • FS géré par serveurs • Configuration par serveurs • Overhead mais GB Ethernet • 1 GB Ethernet -> 80 MB/sec • Fichier I/O • Mondial • FS géré par NAS Head • Configuration par Head Unit NAS Head Machine qui est connectée : • NIC -> réseau TCP/IP • HBA -> SAN (Fibre Channel) Administration du NAS à partir d’un interface web NAS Head 3 composants : • Serveurs de fichiers redondants • Stations de contrôle redondantes • Groupes de disques (storage array) Hardware utilisé • Serveurs de fichiers et stations de contrôle • I386, FCA redondant, alimentations redondant, … • DART (Data Access in Real Time) Linux I/O optimisé NAS Head Stations de contrôle (CS) • • • • • Installation, mise à jour des logiciels Calcul de la performance des serveurs de fichiers « Phone Home » « Dial In » Communication avec les serveurs de fichiers via RPC sur un réseau privé. NAS Head Serveurs de fichiers (FS) • Transfert des données entre Client et le SAN • Téléchargement des logiciels de la station de contrôle lors du démarrage • Configuration à l’aide de la Management Software de la station de contrôle • Redémarrage automatique lors d’une erreur • Connexion Fibre Channel avec SAN • Dynamic Multipathing • Serveurs de fichiers « Hot Spare » NAS : Exemple EMC2 Celerra Nécessité d’un disque physique sur le SA Divisé en 6 Volumes : • • • • • Vol 00 : OS pour la station de contrôle active Vol 01 : OS pour la station de contrôle passive Vol 02 : Boot partition pour les FS et CS Vol 03 : Système BD sauvegardant la configuration du NAS Vol 04 : Journaled FS. Protocole de toutes les opérations sur le File System (fast recovery). Changement niveau « block » ! • Vol 05 : Données de log EMC2 : Control Disk Conclusion SAN • • • • • • • Bon système de sauvegarde pour les Open System Favoriser Fibre Channel Accès au block (applications comme ORAC, OCFS, GFS, …) Beaucoup de produits de différents producteurs Bon rapport Prix/Disponibilité Devient intéressant pour les PME Mais : • distance maximale 10km entre SA et Serveur • Configuration par serveur Conclusion NAS • Extensibilité (Scalability) • Facile d’ajouter des FS ou SA supplémentaires • • • • Facilite l’administration Support de multiple FS Distance entre Client et NAS-HEADs : mondial Mais : Une solution NAS/SAN avec FC est très chère • « THE NETWORK IS THE COMPUTER » ® Sun Microsystem 1982 Matériel Bibliographie Storage Area Networks / Network Attached Storage : « Hohe Datenverfügbarkeit durch Speichernetzwerke » • ISDN : 3-8273-1871-8 Implementing the IBM TotalStorage NAS 300G • http://www.ibm.com/redbooks Démonstration du Red Hat GFS Mise en place d’un SAN RedHat GFS -> logical volume manager « Mount » d’une clé USB comme « block device » à travers le réseau sur les nœuds du cluster Création d’un GFS sur la clé USB « Mount » du FS sur deux machines différentes en même temps. Visualiser un accès multiple à un fichier Schéma : Shared disk (block device) Questions - Réponses ???