Selon différentes études, d'ici 2020, 80 à 90% des données circulant dans l'entreprise seront non structurées, pour des volumes globaux totalisant de 40 à 50 zettaoctets (1021 octets). La raison : ces données sont issues de tendances et de technologies en plein essor, telles la consommation accrue de photos et de vidéos, et l'accélération du déploiement des objets connectés. Toutefois, la question d'un stockage adapté à ce type de données ne semble pas à l'ordre du jour. Or il y a urgence car leurs usages se décuplent - par exemple le double emploi des données de vidéosurveillance de la grande distribution pour étudier le comportement des clients ou l'exploitation d'archives de plusieurs années dans la recherche scientifique.

Le workflow des données, nouveau critère de stockage

Il est temps de s’attacher à comprendre les besoins spécifiques du stockage des données non structurées. Tout d'abord, ces données sont généralement contenues dans des fichiers de grande taille, difficilement compressibles. Ensuite, elles doivent être stockées sur le long terme car leur valeur croît avec le temps. Enfin, elles nécessitent un accès et un partage rapides pour une multitude d'utilisateurs.

Le stockage sur disque commence à montrer ses limites : extraction trop lente des données, coût élevé et protection insuffisante. L'alternative réside dans un stockage multiniveau conçu en fonction des flux que suivent ces données. Celui-ci combine une technologie de disques (primaire et secondaire à forte capacité), de bandes et le Cloud. Collectées, stockées, traitées, elles doivent rester continuellement disponibles pour de prochains usages. Le système de stockage adéquat doit permettre d'ingérer de grandes quantités de données non structurées, d’assurer leur partage via le réseau et de solliciter des modes de stockage économiques, comme la bande. Basé sur les workflows, il permet aux entreprises d'exploiter plus agilement leurs données non structurées, tout en maîtrisant leur budget.