Accueil > Applications, DataCenter, DSI, Générale, Innovation, Stockage, Tendances > L’avenir des infrastructures de stockage passe par la technologie FLASH #EMC #VFCache #oracle

L’avenir des infrastructures de stockage passe par la technologie FLASH #EMC #VFCache #oracle


Si la performance des processeurs a explosé au cours des dernières années, celle des disques durs n’a pas suivi. Le stockage deviendrait il un goulet d’étranglement pour les performances ?

Un goulet qu’il est possible de faire disparaître avec la technologie Flash utilisée jusqu’à présent dans les disques SSD, mais la révolution est en route …

EMC a été un précurseur  de cette révolution. Ce n’est plus un secret depuis longtemps, EMC est un grand partisan du stockage à base de mémoire Flash.

Nous avons ainsi été le premier grand constructeur à proposer des disques SSD dans nos baies de stockage (dès 2008) et a aussi mis sur le marché des baies 100% Flash (le VNX5700, puisqu’il faut le citer).

Project Lightning devient VFCache :

Plus récemment EMC a tracé une stratégie ambitieuse d’utilisation de la mémoire Flash avec le lancement de la technologie VFCache et l’annonce du « projet Thunder ».

Cet engagement sans ambiguïté vis-à-vis de la mémoire Flash n’a rien à voir avec le hasard. Il est le fruit d’un constat simple : Avec l’explosion des données, le stockage devient de plus en plus un goulet d’étranglement pour les applications modernes.

Un déséquilibre croissant entre les performances des processeurs et celles du stockage sur disque Pour mieux comprendre pourquoi la mémoire Flash est l’objet de toutes les attentions dans le monde du stockage il suffit de faire une pause et de regarder l’évolution des performances des processeurs, de la mémoire et du stockage au cours des dernières années.

Comme l’explique remarquablement David A. Paterson, un professeur d’architectures informatiques de l’Université de Berkeley, la performance des processeurs a progressé bien plus rapidement que celle des mémoires et surtout que celle du stockage au cours des 30 dernières années.

La performance des processeurs a progressé plus vite que celle de l’ensemble des autres composants des serveurs qui deviennent peu à peu des goulets d’étranglement pour la performance des systèmes (ici le fossé entre performance CPU et mémoire vu par David A. Paterson de Berkeley). Selon lui, la performance moyenne des processeurs a progressé à un rythme moyen de 50% par an, tandis que la bande passante mémoire progressait de 27% par an et que celle des disques durs progressait de 28% par an.

Plus grave, la performance en nombre d’opération par seconde des disques durs n’a guère évolué au cours des 10 dernières années. Ainsi un disque d’entreprise à 10 000 tr/mn reste péniblement sous la barre des 150 IOPS (opérations d’entrées/sorties par seconde) en accès aléatoires, et un disque SATA peine à franchir la barre des 70 à 80 IOPS.

Dans le même temps celle des processeurs était multipliée par 100. De même, les gains en latence ont été ridicules au cours des 25 dernières années. Seagate note ainsi qu’un disque d’entreprise avait un temps d’accès de 60 ms en 1987. Depuis on est passé à 5 ms pour les disques d’entreprises à 15 000 tr/mn, mais toujours à environ 9 ms pour un disque SATA 7200 tr/mn.

Cette amélioration par un facteur de 6 à 12 fois peut paraître impressionnante. Sauf que dans le même temps, la latence d’accès à la mémoire a été divisée par plus de 100 000 et la performance unitaire des processeurs (mesurée en Flops) a été multipliée par plusieurs dizaines de millions de fois. Le résultat est un déséquilibre croissant : d’un côté des processeurs capables de performances théoriques croissantes et de l’autre des goulets d’étranglement terribles en matière d’accès aux données du fait des faibles performances des disques durs.

Un particulier peut s’en rendre compte très simplement : remplacer le disque dur de sa machine par un disque SSD à base de mémoire Flash apporte une amélioration des performances sans commune mesure avec l’amélioration de performances que permettrait l’utilisation d’un processeur plus rapide.

Car l’utilisation du SSD fait sauter le goulet d’étranglement que représente le disque dur. Dans l’univers des datacenters, le lancement récent des derniers Xeon E5-2600 d’Intel est de nature à amplifier un peu plus le problème. Ces puces affichent une aptitude jusqu’alors inconnue à traiter des données. Mais les coupler à des disques durs revient à tenter de satisfaire l’appétit d’un géant avec un grain de riz. Le problème avec la famine en informatique est que faute d’être alimenté en données, un serveur voit ses performances s’effondrer.

Pour utiliser une métaphore, c’est un peu comme si l’on achetait une Ferrari pour la faire rouler à 20km/h sur des chemins de traverse. Si la capacité des disques durs a progressé rapidement depuis 10 ans, leur performance mesurée en IOPS n’a absolument pas évoluée, créant un fossé croissant avec la performance des disques durs (Source : EMC) La Flash réconcilie stockage et « compute » Des chercheurs comme Jim Gray, chez Microsoft avaient pointé du doigt ce problème dès décembre 2006 et leurs prédictions se sont avérées fondées.

La technologie Flash est la solution aux problèmes de performance des disques durs et ce de façon spectaculaire – par exemple, un disque SSD peut facilement atteindre aujourd’hui les 100 000 IOPS en écritures aléatoires et la carte PCI-express à base de mémoire Flash SLC  EMC VFCache peut produire près de 350 000 IOPS en écriture aléatoire et plus de 750 000 IOPS en lecture, soit plus que ce que permettent plusieurs milliers de disques durs.

Cette extrême performance de la carte VFCache est liée à deux facteurs. Tout d’abord les performances intrinsèques de la mémoire Flash, mais aussi au fait que la carte PCI-express Flash s’installe directement dans le serveur qui accède aux données et sur un bus qui n’est pas un goulet d’étranglement.

Les choses seraient potentiellement différentes si cette carte était dans une baie de stockage reliée au serveur par une connexion Ethernet. Ainsi la bande passante d’une connexion Gigabit Ethernet utilisée via le protocole iSCSI est d’un peu plus de 100 Mo/s, soit un plafond de 25 000 IOPS de 4Ko (100 Mo divisés par 4 Ko).

Par comparaison, une connexion Fibre Channel à 4Gbit/s permet un maximum de 100 000 IOPS de 4 Ko, une connexion à 8 Gbit/s, 200 000 IOPS, etc… le réseau serait alors le goulet d’étranglement.

Bien sûr, le niveau de performance offert par une carte comme VFCache a un prix qui peut paraître élevé, mais il n’est rien face à celui des milliers de disques qui seraient nécessaires pour atteindre les mêmes performances.

Cela ne veut pas non plus dire que tous les disques durs vont être remplacés par de la Flash. Tout d’abord la production mondiale actuelle de Flash n’y suffirait pas, et ensuite, les disques durs restent le moyen le plus économique pour stocker en ligne de très grandes quantités de données.

En fait, la mémoire Flash crée une nouvelle classe de stockage qui vient s’intercaler entre la mémoire vive et les disques durs traditionnels.

Ses performances en font le support idéal le stockage des données les plus fréquemment accédées dans les baies de stockage (ce qu’EMC a fait très tôt en incorporant des disques SSD dans ses baies Symmetrix et VNX et en développant la technologie de tiering FAST, qui permet de placer automatiquement les données les plus sollicitées sur la Flash et de déplacer les données moins actives sur les disques durs) ou afin de servir de cache additionnel (ce que permet FAST Cache sur les baies EMC).

La mémoire Flash peut aussi servir à doper les performances des serveurs en servant d’étage de cache pour accélérer l’accès aux baies de stockage, la stratégie adoptée par EMC avec VFCache. On marie ainsi le meilleur des deux mondes. Les serveurs disposent d’un accès ultra-performant en lecture aux données situées sur les baies et ils se reposent sur ces dernières pour l’écriture, le stockage et la protection de ces données. On allie donc le meilleur des performances de stockage locales avec le meilleur en terme de protection des données sur le SAN. Enfin, la mémoire Flash a aussi un rôle à jouer dans les baies de stockage, via les SSD, afin de servir de support de stockage pour les données les plus actives ou afin de servir de cache additionnel (ce que permet FAST Cache sur les baies EMC).

Des applications accélérées et des gains économiques palpables Les tests réalisés en interne par EMC avec des cartes VFCache insérées dans des serveurs connectés par ailleurs à des baies Symmetrix VMAX et VNX ont ainsi mis en évidence un triplement de la bande passante de stockage et une réduction de 60% de la latence pour les applications transactionnelles reposant sur des logiciels comme Oracle ou SQL Server Ces gains sont liés au fait que les données les plus sensibles sont mises en cache par la carte VFCache – ce qui évite au processeur d’aller les chercher sur la baie de stockage.

On bénéficie ainsi du double avantage des performances de la Flash et du fait que la carte est directement sur le bus PCI du serveur ce qui évite d’avoir à effectuer un accès à la baie de stockage via le réseau.

Sans surprise, de tels gains de performances se traduisent aussi par des gains économiques importants. Ainsi, les tests menés par EMC ont mis en lumière une multiplication par trois des performances d’une application transactionnelle basée sur Oracle avec les cartes de cache VFCache.

Cela veut concrètement dire qu’avec VFCache un serveur peut supporter trois fois plus d’opérations que sans VFCache.

Ou si on l’exprime d’une autre façon, qu’il faudra trois fois moins de serveurs (ou de processeurs) pour effectuer une quantité de travail donnée.

Enfin rappelons qu’une licence du SGBD Oracle entreprise coûte 380 000 $ par serveur bi-processeur Xeon récent (typiquement un serveur bi-socket Xeon E5-2600 à 16 cœurs) et qu’une division par trois du nombre de serveurs de bases de données génère donc une économie en termes de licences très supérieure au coût des cartes VFCache (et c’est sans compter les économies liées à l’achat des serveurs et à leur exploitation).

Avec de tels bénéfices et les développements encore en cours chez EMC autant dire que l’on n’a pas fini d’entendre parler de la mémoire Flash. A lire également : EMC VFCache dope la performance des applications à la Flash Matt Komorovski : a history of storage cost L’évolution du prix des disques durs et des SSD UCLA – Introduction to Operating Systems lectures.

A bientôt pour de nouvelles aventures avec Project Thunder ! La FLASH va conquérir le réseau …

Étiquettes : , , , , , ,
  1. Aucun commentaire pour l’instant.
  1. No trackbacks yet.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :