Technique ...">
Technique ...">

L'utilité de la déduplication de données

  • comments


Technique de compression de données, la déduplication sert à supprimer les données redondantes présentes dans un système afin de libérer le stockage. En plus d'éliminer les copies excessives, ce concept peut être utilisé pour sauvegarder des données et transmettre celles-ci sur un réseau spécifique.

Déduplication de données, que signifie ce terme ?

En informatique, la déduplication de données ou factorisation de données est une technique qui consiste à factoriser plusieurs données identiques afin de libérer davantage d'espace de stockage. Pour se débarrasser des fichiers en double, après l'écriture des données contenues dans le disque, elle peut être exécutée pendant la sauvegarde des documents trouvés dans le système de stockage. Pour ne pas perdre aucunes données et maximiser les économies, ce processus s’exécute simultanément à la volée et en arrière-plan. Afin d'éviter l'interférence avec le parcours client, la déduplication est utilisée de manière opportuniste à la volée et de façon exhaustive en arrière-plan. Pas besoin d'une intervention manuelle, la déduplication s'active de manière automatique sur tous les agrégats et volumes.

Comment fonctionne la déduplication de données ?

Pour éliminer les blocs de données déjà dupliqués, cette technique fonctionne au niveau du bloc 4 Ko dans un volume complet, ainsi que dans tous les volumes de l'agrégat. Pour ce faire, la déduplication a besoin de la technologie des empreintes. À la fin de l'écriture sur le système, une analyse des blocs entrants est réalisée par le moteur dédié à la déduplication à la volée. Ensuite, une empreinte est créée et stockée dans un magasin dédié au hachage.

À la fin du calcul de l'empreinte, le magasin de hachage effectue une recherche. Dans le cas où une empreinte correspond à celle contenue dans la mémoire cache, le système déclenche une alerte. Une fois le bloc donneur découvert, le système en question exécute directement une comparaison avec l’ensemble des données actuelles, octet par octet. C'est à partir de cette comparaison minutieuse que le système détecte les données dupliquées.

Concernant la duplication en arrière-plan, elle fonctionne de la même façon que la duplication à la volée. Dans l'agrégat, il y a une analyse de l’intégralité des données et la suppression des doublons tout en comparant les empreintes des blocs. Ces procédures sont nécessaires afin d'éliminer les faux positifs et d'assurer qu'aucune donnée n'est perdue lors de la duplication.

Les avantages de la déduplication 

Dans le but de rendre le stockage des bases de données plus performant, la déduplication de donnée, comme son nom l'indique, a pour fonction de réduire les données. En plus de cela, elle présente également d'autres avantages :

  • analyse minutieuse de toutes les données ;
  • impact sur les performances minimes ;
  • exécution en dehors des périodes de forte activité ;
  • charge de traitement afférente aux soutiens logiciels diminuée.

Pour effectuer une sauvegarde des données avant leur transfert sur un réseau, il faut les dupliquer en éliminant les doublons dans une ou plusieurs bases de données. De cette manière, nous pouvons libérer plus d'espace de stockage tout en améliorant la performance de notre système informatique.

 

Google http://www.cosnix.org

0.00 / 5 (0s votes) l utilit de la d duplication de donn es 40