La multiplication des sources et la quantité croissante d’informations disponibles sur le web augmentent de manière considérable le volume des bases de données des sociétés.
Big data, un changement radical du rapport à la donnée
Il y a quelques années elles contenaient essentiellement les coordonnées et les derniers achats du client. Aujourd’hui, avec l’adoption des réseaux sociaux, les systèmes de géolocalisation et autres technologies innovantes, l’entreprise peut aisément récupérer des renseignements complémentaires sur le comportement de ses acheteurs ou encore sur son e-reputation et ainsi alimenter ses bases de données. Le web est une mine d’informations précieuses, disponibles et souvent très faciles à récolter qui permettent aux entreprises de détecter les tendances et de définir leurs stratégies.
Big data, un changement radical du rapport à la donnée
En plus du volume important de données, ce phénomène que l’on appelle communément le Big data se caractérise également par la vélocité des informations et par la variété des formats. En effet, d’une source à l’autre, le format du contenu va différer : du texte, de la vidéo, des images,… L’ensemble de ces caractéristiques font que le Big data implique un changement radical du rapport avec la donnée. On assiste à une sorte d’obésité des bases de données, qu’elles soient structurées ou non. Le décuplement de leur taille entraîne un stockage et une infogérance adaptés. Les bases de données SQL habituelles ne sont pas formatées pour accueillir et traiter ces gros volumes de données.
Récolter ces informations est une bonne chose mais encore faut-il les stocker et les traiter correctement pour en extraire des informations stratégiques. C’est là tout l’enjeu du Big data que l’on a tendance à oublier. Il faut une réelle réflexion en amont sur le contenu des bases de données pour éviter de croiser des informations non pertinentes.
Au-delà de la question du stockage, cela soulève le problème de la pertinence et de l’exploitation des données récoltées. A la différence des anciennes bases de données, qui se construisaient progressivement, les bases actuelles pourraient rapidement « exploser » si les filtres mis en place ne sont pas assez précis. Le problème de l’exploitation des données se pose déjà avec certaines bases de données CRM ou BI qui concentrent de gros volumes de données. Est-il nécessaire de garder sur une même base de données 10 voire 15 ans d’historique ? Faut-il garder toutes ces données au même endroit avec les mêmes niveaux d’exigences en termes de disponibilité, de performance et de sécurité ? La rigueur est de mise dans le traitement de ces données.
Plus la taille de la base de données est importante plus elle sera gourmande en ressources et va nécessiter une infogérance particulière. Pour ce faire, il est préférable de repenser la gestion de ces données critiques pour en tirer le meilleur. Il faut identifier les données les plus pertinentes pour l’entreprise et les stocker dans une base de données spécifique. On concentrera sur celle-ci davantage d’efforts en termes de performance et de sécurité. Ainsi l’analyse de ces données sera moins énergivore et donc moins coûteuse.
Téléchargez cette ressource
Plan de sécurité Microsoft 365
Les attaquants savent comment prendre le contrôle de votre tenant Microsoft 365, et vous, savez-vous comment le reprendre en main ?
Les articles les plus consultés
- Intelligence Artificielle : DeepKube sécurise en profondeur les données des entreprises
- 9 défis de transformation digitale !
- Stockage autonome, Evolutivité & Gestion intelligente, Pure Storage offre de nouvelles perspectives aux entreprises
- Databricks lève 1 milliard de dollars !
- L’utilisation des données pour survivre !
Les plus consultés sur iTPro.fr
- Sauvegarder les données ne suffit plus : il faut refonder le poste de travail
- Cybermalveillance : 2025, seuil franchi pour les victimes comme pour les cybercriminels
- Communes, entreprises ? Non, face au RGAA 5, l’IA seule ne rendra pas vos sites accessibles
- Construire la souveraineté numérique en Europe grâce à un écosystème ouvert et collaboratif
Articles les + lus
Les défaillances des pipelines de données pèsent lourdement sur la performance des grandes entreprises
Les nouvelles menaces liées à l’IA obligent les entreprises à dépasser la seule stratégie de sauvegarde
Sauvegarder les données ne suffit plus : il faut refonder le poste de travail
Construire la souveraineté numérique en Europe grâce à un écosystème ouvert et collaboratif
Editeurs, crawlers et équipes sécurité, les alliances qui feront tenir le web
À la une de la chaîne Data
- Les défaillances des pipelines de données pèsent lourdement sur la performance des grandes entreprises
- Les nouvelles menaces liées à l’IA obligent les entreprises à dépasser la seule stratégie de sauvegarde
- Sauvegarder les données ne suffit plus : il faut refonder le poste de travail
- Construire la souveraineté numérique en Europe grâce à un écosystème ouvert et collaboratif
- Editeurs, crawlers et équipes sécurité, les alliances qui feront tenir le web
