Le Big Data, késako ?

Big data… Cela fait déjà un bon moment que vous croisez ce terme à la fois barbare et terriblement à la mode au détour de très nombreux articles sur la toile… sans savoir réellement ce qu’il signifie.

Décryptons ensemble cette tendance de fond qui a d’ors et déjà révolutionné notre quotidien sans en avoir l’air, et dont il est parfois délicat de donner une définition à la foi précise et exhaustive…

Définition d’un concept à la mode

Le Big Data (littéralement « grosses données » parfois traduit aussi par « infobésité ») se définit généralement autour de 3 caractéristiques principales :

  1. Le volume : qui correspond à la quantité de données numérique à gérer. Avec l’explosion de la consommation des services « webisés » et des réseaux sociaux, ces données ont considérablement augmenté ces dernières années et sont devenues véritablement ingérables sans l’aide d’outils adaptés.

  2. La variété : qui s’explique par le caractère déstructuré de ces données aux formats variés et aux multiples sources (contenus sémantiques, vidéos, données de géolocalisation, etc.), qui ne présentent pas un « profil type ».

  3. La vélocité : qui fait référence à la vitesse à laquelle ces données se forment, à l’urgence avec laquelle elles doivent être traitées, et la rapidité avec laquelle l’information pertinente doit être extraite.

Le Big Data fait donc référence à cette masse de données, en constante augmentation, aux multiples formats, qui se stockent à toute vitesse, mais également aux nouveaux moyens technologiques développés pour stocker, croiser et traiter ces données, afin de les faire parler et de les mettre au service de leurs consommateurs, voir des citoyens…

Promesses, limites et dangers du Big Data

Permettre aux entreprises de mieux cibler et donc de mieux servir leurs clients, prévoir en temps réel les besoins d’approvisionnement d’un supermarché, personnaliser les traitements médicaux… Voici quelques exemples de ce que permet le Big Data. Mais les compétences nécessaires pour exploiter correctement ces données sont encore rares et toutes les entreprises ne peuvent pas s’offrir à la fois, les experts « systèmes » capables de mettre en oeuvre les outils et l’architecture nécessaires, et les « datas scientists » véritables moutons à 5 pattes dotés d’une triple sensibilité : statistique, informatique, marketing. De nombreuses données ont donc tendance à croupir encore dans leurs data warehouses (entrepôts de données) et à se dévaloriser faute d’être traitées ou exploitées…

Mais l’ère du Big Data porte aussi le risque d’une surveillance accrue. Avec le Big Data, « Big Brother is watching you » n’a jamais été aussi proche de la réalité, et, être capable aujourd’hui de se fondre dans l’anonymat du web est devenu un véritable privilège ! Connaître les possibilités et les limites de ces nouvelles technologies sera donc indispensable pour en réglementer l’usage sans en entraver les développements utiles.

Quelques chiffres récents sur le Big Data 

  • – Nous produisons 2,5 trillions d’octets de données par jour,

  • – La production de données sera 44 fois plus importante en 2020 qu’en 2009,

  • – 4,4 millions d’emplois seront créés dans le monde pour soutenir le Big Data d’ici 2015,

  • – Seuls 12% des données des entreprises sont actuellement exploitées.