Ce court article a pour visée de présenter le concept  du « Big Data » dans les grandes lignes sans rentrer dans des détails techniques. Le but étant de permettre au lecteur de survoler les concepts et d’acquérir le vocabulaire.

Génèse de la Big-Data

Né de l’explosion quantitative des données numériques, le Big-Data a obligé les grands acteurs de l’informatique à trouver de nouvelles manières de voir et analyser le monde.

Le développement de ce nouveau concept est apparu en 3 temps :

1. Lors de la démocratisation d’internet qui a fait apparaître des quantités de données sans cesse grandissantes et ce, dès la fin des années 90 et début des années 2000.

2. Dès l’apparition de l’internet mobile et sa démocratisation (portée par l’iPhone d’Apple et les smartphones Android).

3. Avec l’augmention du volume des données qui a explosé avec l’arrivée des capteurs connectés technologie nommée Internet Of Thing (IoT).

 

Le terme Big Data est apparu en 1997

Le Big Data est défini par la règle des 3V qui décrit ces nouvelles contraintes :

1. Volume : les masses à traiter sont en constantes augmentation

2. Vitesse : le temps d’acquisition de ces données doit se faire en temps réel ou avec une latence réduite

3. Variétés : les données sont déstructurées et proviennent de sources variées (capteurs de, smartphones, bases de données, logiciels, fichiers Excel, etc…)

 

Révolution dans le monde informatique

gafa

L’informatique a été en plein boom sur toute la fin des années 2000. Le volume des données étant considérable, il était quasi-impossible de stocker toutes ces informations, les analyser tout en gardant le système d’information réactif. Les concepts que nous manipulions à cette époque (Scalabilité horizontal, MVC, architecture logicielle en 3 couches, Bases relationnelles, etc…) ont vite démontré leurs limites.

De grands acteurs comme les GAFA (Google, Apple, Facebook et Amazon) ainsi que les communautés techniques, se sont lancés dans le développement de nouveaux outils et paradigmes d’architecture (cluster extensibles, Micro-Services, Scalabilité verticale,  NoSQL, …) leur permettant de répondre à ces nouveaux défis.

L’apparition de nouveaux outils comme Hadoop,  Elasticsearch, Spark (et une myriade d’autres) ont permis l’amorçage d’un développement rapide du secteur. L’intelligence artificielle joue un rôle central dans l’analyse de cette masse d’information.

Néanmoins, ces nouvelles technologies ont dynamisé l’informatique et ses applications ont eu des conséquences sociétales importantes (qui ne sont pas à prendre à la légère, si on ne veut pas vivre dans un monde proche de « 1984 » d’Orwell).

Toutes les données détenues par les entreprises sont aujourd’hui équivalent à un gisement de pétrole (Data Lake) à partir duquel il faut extraire de la valeur ajoutée.

Les applications du Big-Data

Le Big Data permet l’acquisition, le traitement et l’analyse de données pour déterminer des tendances ou des perspectives de marché à venir.

Exemples de secteurs révolutionnés par ce nouveau concept :

– La médecine (dépistage de certaines maladies génétiques, anticipation de cancers, etc…),

– La cartographie du génome humain,

– Sociologie : analyse du comportement des individus, déduction de certaines tendances ou groupements et anticipation de leurs comportements,

– En Marketing, l’analyse du comportement des individus sur le net, leurs achats etc,

– Gestion des réseaux de transport,

– La météorologie,

– La gestion des réseaux énergétiques complexes type les Smart Grid planétaires (avec le support de blockchains par exemple qui est un autre sujet passionnant que nous développerons dans un autre article),

Et de nombreux autres nouveaux concepts émergents de jour en jour.

Le développement exponentiel du Big Data a permis de tirer dans son sillage le développement de l’intelligence artificielle qui a pour tâche d’analyser les données.

Exploitation des données – Notion de « Data Lake » et « intelligence artificielle »

Le  schéma ci-dessous donne un exemple d’utilisation du Big Data. Il décrit le mode opératoire de l’acquisition de données jusqu’à la formalisation de rapports exploitables.

big-data-1

L’exercice d’exploration des données se fait par un Data Scientist, métier qui est apparu avec le Big-Data. Cet exercice est appelé : Data Mining ou exploration des données.

Le rapport donnera des tendances permettant aux acteurs humains d’entreprendre des actions.

Par exemple :

« Les jours où le temps est gris et froid. Que la personne aura passé 1h30 dans les bouchons. Le soir elle commandera un plat préparé et louera un film en VOD. »

Ainsi quand la société de Pizza ou VOD détectera que ces conditions sont réunies elle enverra un mail ou texto à son client lui recommandant certains produits.

Une technologie d’avenir et un créneau porteur d’opportunités pour les entrepreneurs

Avec l’utilisation sans cesse grandissante d’internet, des smartphones et avec l’arrivée progressive des IoT, le Big-Data est à ses débuts. Combiné à d’autres technologies comme l’intelligence artificielle, l’IoT ou les blockchains par exemple, il promet beaucoup des applications passionnantes pour l’avenir.

Des spécialistes de divers domaines (scientifique, économique, marketing,…) pensent que nous sommes à l’entrée de la 3e Révolution Industrielle qui sera portée par le numérique avec le BigData et l’AI comme principaux vecteurs. Cependant, la grande majorité des applications de ces technologies sont encore à inventer. Laissons place à l’innovation.

Pierre Medina,
Amayas Consulting
Twitter: @pmedina

#

6 May 2017