3 dagen, 7 uur ago

Expert vector database

Context

In het kader van de evolutie van AI-projecten binnen Le Forem, wenst het Departement Informatiesystemen zijn dienstenaanbod uit te breiden door een oplossing voor een vectoriële en NoSQL-database te integreren. De gekozen oplossing is Azure Cosmos DB.

De voorziene schaalvergroting (volumetrie, queries, nieuwe AI-use cases) vereist een schaalbare, performante en geoptimaliseerde oplossing voor use cases met hoge volumetrie (AI, RAG, hybride search…).

Doelstelling van de opdracht

Evalueren, afbakenen en operationele aanbevelingen formuleren om het gebruik van Cosmos DB als vector database te industrialiseren in een AI-context, met waarborg van:

  • Performantie en robuustheid
  • Beheersing van de kosten
  • Langetermijn exploitatie

Scope van de opdracht

De consultant zal zich richten op de volgende aspecten:

  • Analyse
  • van de huidige architectuur en de geplande toepassingen
  • Identificatie van beperkingen en risico’s met betrekking tot:
  • Schaalvergroting (volumetrie, QPS, latentie)
  • Beheer van vector indexen
  • Datadistributie
  • Limieten van Cosmos DB
  • Beveiligingsrisico’s
  • Aanbevelingen over:
  • Architectuurkeuze (modellering, partitionering, indexering, RAG, hybride search)
  • Best practices voor industrialisatie
  • Schaalbaarheids- en veerkrachtstrategieën
  • Kostenbeheersing
  • Duidelijkheid over rollen en verantwoordelijkheden van de directies binnen DSI (infra, data, development) rond het gebruik en de governance van Cosmos DB en bijhorende technologieën
  • Voorstel van een monitoring- en observability-aanpak (performantie, verbruik, alerting)
  • Identificatie van operationele aandachtspunten (exploitatie, onderhoud, schaalbaarheid)
  • Bondige en actiegerichte rapportering voor DSI

Verwachte deliverables

  • Document met duidelijke en geprioriteerde aanbevelingen
  • Doelarchitectuurschema ter ondersteuning van de implementatie
  • Concrete, direct toepasbare aanbevelingen voor de technische teams
  • Mondelinge presentatie aan stakeholders

Uitvoeringsmodaliteiten

Duur: maximaal 10 dagen, gespreid tussen half januari en eind februari, afhankelijk van de beschikbaarheid van stakeholders.

Aanwezigheid op locatie vereist voor:

  • De initiële afbakening
  • De meetings voor rapportering en presentatie van aanbevelingen

De rest van de opdracht kan op afstand worden uitgevoerd.

De consultant kan rekenen op de interne teams (data scientists, architects, technical experts…) voor de succesvolle uitvoering van de opdracht.

Solliciteer voor deze vacature

This position was originally posted on Pro Unity.

It is publicly accessible, and we recommend applying directly through the Pro Unity website instead of going through third party recruiters.

Nieuwsbrief inschrijving illustratie