Lorsque vous développez une application, la donnée que vous utilisez n'est pas forcément consultée ou modifiée à la même fréquence et selon cette fréquence on ne la traite pas de la même façon.

Pour illustrer cette différence on parle alors de température de la donnée.

Comparatif de données chaudes et froides

Il est bon de noter que la notion de température est à rattacher à un contexte. Par exemple dans un réseau social tel que Facebook : on qualifiera de donnée froide les photos qui ont 10 ans dans votre historique de profil.

Alors que dans le cas d'un site d'annonces qui ne modifie ces dernières qu'une fois tous les 3 jours, on considérera également que c'est de la donnée froide. Cela malgré le fait qu'on parle de jours et non plus d'années.

La donnée chaude est généralement plus valorisée d'où sa haute disponibilité

La donnée chaude

La donnée chaude est une donnée généralement hautement volatile, sujette à changements fréquents et dont la disponibilité doit être le plus rapide possible.

Par exemple les données dans le cloud telles que nos photos sont considérées comme de la donnée chaude, malgré le fait que l'on ne les consultes pas forcément tous les jours (et c'est là le problème du stockage cloud, car la haute disponibilité coûte plus cher).

On parlera aussi de donnée chaude en terme de fréquence d'actualisation, par exemple un tableau de bord d'une action en bourse est une donnée chaude, les cours ne faisant que varier.

La donnée froide

La donnée froide, elle est très rarement actualisée par rapport à sa fréquence de consultation. L'archivage de fichiers peu consultés par exemple est une donnée froide.

Elle s'accorde parfaitement avec une politique de cache HTTP ou autre et avec du matériel peu performant. Elle n'a généralement pas besoin d'être stockée sur un disque à haute disponibilité.

De plus, la donnée froide coûte moins cher d'entretenir au vu du prix du matériel et des techniques utilisées. Disques lents ou cache qui évite des calculs inutiles.

En conclusion

Dans vos applications, vous aurez toujours un équilibre entre de la donnée froide et de la donnée chaude. Pensez à bien ajuster les politiques de cache et de stockage de ces données afin d'optimiser vos coûts, performances et aussi pour penser à l'écologie et à la préservation de la planète 🌍.