3 jours, 5 heures ago

Expert DB vectorielle

Contexte

Dans le cadre de l’évolution des projets IA au sein du Forem, le Département des Systèmes d’Information souhaite enrichir son offre de services en intégrant une solution de base de données vectorielle et NoSQL. La solution retenue est Azure Cosmos DB.

La montée en charge prévue (volumétrie, requêtes, nouveaux cas d’usage IA) impose de garantir une solution scalable, performante et optimisée pour des cas d’usage à forte volumétrie (IA, RAG, recherche hybride…).

Objectif de la mission

Évaluer, cadrer et formuler des recommandations opérationnelles pour industrialiser l’usage de Cosmos DB comme base vectorielle dans un contexte IA, en garantissant :

  • Performance et robustesse
  • Maîtrise des coûts
  • Exploitabilité à long terme

Périmètre de la mission

Le consultant interviendra sur les axes suivants :

  • Analyse
  • de l’architecture actuelle et des usages prévus.
  • Identification des contraintes et risques liés à :
  • Montée en charge (volumétrie, QPS, latence)
  • Gestion des index vectoriels
  • Distribution des données
  • Limites propres à Cosmos DB
  • Risques de sécurité
  • Recommandations sur :
  • Choix d’architecture (modélisation, partitionnement, indexation, RAG, recherche hybride)
  • Bonnes pratiques d’industrialisation
  • Stratégies de scalabilité et de résilience
  • Maîtrise des coûts
  • Clarification des rôles et responsabilités des directions du DSI (infra, data, développements) autour de l’usage et de la gouvernance de Cosmos DB et des technologies associées
  • Proposition d’une approche de monitoring et d’observabilité (performance, consommation, alerting)
  • Identification des points de vigilance opérationnels (exploitation, maintenance, évolutivité)
  • Restitution synthétique et actionnable à destination du DSI

Livrables attendus

  • Document de recommandations claires et priorisées
  • Schéma d’architecture cible pour faciliter la mise en œuvre
  • Préconisations concrètes, directement exploitables par les équipes techniques
  • Restitution orale aux parties prenantes

Modalités d’exécution

Durée : 10 jours maximum, étalés entre mi-janvier et fin février, selon les contraintes des parties prenantes.

Présence sur site requise pour :

  • Le cadrage initial
  • Les réunions de restitution et présentation des recommandations

Le reste de la mission pourra être réalisé en distanciel.

Le consultant pourra s’appuyer sur les équipes internes (data scientists, architectes, experts techniques…) pour mener à bien la mission.

Postuler pour cet emploi

This position was originally posted on Pro Unity.

It is publicly accessible, and we recommend applying directly through the Pro Unity website instead of going through third party recruiters.

Illustration d'inscription à la newsletter