Développement d'un Datalake en 3 mois

Contexte

Nous avons accompagné une start-up, spécialisée dans l'intelligence géo-contextuelle, à se développer en créant une architecture data capable d’ingérer une grande volumétrie de données.

 

Le challenge

L’entreprise disposait de 2 sources différente de données, des données sur des points d’intérêts (POI) comme des magasins ou des musées par exemple ainsi que des données de mobilité.
Le premier challenge a été de restituer une vision agrégée des deux sources de données et de ce fait de gérer un volume de données important dès la première phase.

Ensuite, il a fallu développer une solution capable de répondre aux problématiques de leurs clients :
• Quel est le magasin le plus populaire ?
• Est-ce que mes visites augmentent ?
• Dans quels magasins vont les clients avant/après avoir visité le mien ?


L’architecture devait être suffisamment flexible pour intégrer d'autres sources, comme les conditions météorologiques, afin d'obtenir des données plus riches. De plus, cette start-up disposait d’une équipe restreinte, de 2 personnes, pour maintenir la solution.

 

La solution

Nous avons développé un datalake dans le cloud GCP, capable d’ingérer diverses sources de données tout en garantissant leurs qualités, et permettant leurs enrichissements, leurs associations et leurs extractions dans différents formats de fichiers. De plus, nous avons accompagné cette start-up à construire une équipe Data dédiée.

 

 

Stack Technique

 

 

 

Les résultats

 

3

Mois pour construire un Datalake

5

Personnes recrutées grâce à l'accompagnement Theodo Data & AI

 

Besoin d'un avis d'expert ? 

Contactez-nous