Développeur IA Python
Constellio Inc.
- Québec, QC
- Permanent
- Temps-plein
Le rôle combine développement Python, intégration LLM, architectures RAG (Retrieval-Augmented Generation) et déploiement cloud.Responsabilités Principales :1. Développement IA, LLM et prompt engineering:
- Concevoir, optimiser et maintenir des prompts (prompt engineering) incluant system, few‑shot et chaînes de prompts.
- Intégrer des modèles LLM (OpenAI / Azure OpenAI) dans des services backend.
- Configurer les paramètres de génération (température, top‑k, contexte).
- Gérer l’utilisation des tokens, les coûts et la qualité des réponses générées.
- Mettre en place des pipelines d’embeddings pour documents et requêtes.
- Réaliser de la recherche vectorielle dans une base (ex. ChromaDB ou FAISS).
- Contribuer au développement d’architectures RAG pour améliorer la précision et la factualité.
- Développer des APIs robustes avec Flask ou FastAPI, incluant documentation OpenAPI.
- Gérer le streaming des réponses LLM, la gestion d’erreurs et la journalisation.
- Participer à la mise en place de tâches asynchrones (Celery/Redis) pour ingestion ou indexation.
- Déployer les services IA et backend dans Azure (App Services, Container Apps, Key Vault).
- Concevoir et maintenir des images Docker ; connaissance des environnements Kubernetes (AKS).
- Appliquer des bonnes pratiques de sécurité (OAuth2/OIDC, gestion des secrets).
- Excellente maîtrise de Python et d’un framework API (Flask ou FastAPI).
- Expérience concrète avec les APIs LLM (OpenAI / Azure OpenAI).
- Connaissance des concepts RAG, embeddings et recherche vectorielle.
- Compétences en prompt engineering (incluant optimisation et structuration des prompts).
- Déploiement et intégration cloud dans Azure.
- Maîtrise de Docker ; bonnes bases en Kubernetes.
- Compréhension des mécanismes de sécurité API (OAuth2, OIDC, JWT).
- Connaissance de LangChain ou LlamaIndex.
- Expérience avec Celery/Redis, PostgreSQL, Pydantic.
- Familiarité avec le NLP francophone.
- Expérience CI/CD (GitLab, Azure Pipelines).
- Diplôme en informatique, IA ou équivalent.
- Expérience de 3ans minimum en intégration LLM/IA dans des applications backend.
- Capacité à travailler en cloud et à résoudre des enjeux techniques complexes.
- Rigueur, autonomie et bonne communication.
- Bilingue français / anglais.
- Poste à 100% Télétravail
- Rémunération attractive.
- Opportunités de développement professionnel et de carrière.
- Environnement de travail stimulant et respectueux.
- Participation à des projets innovants avec des entreprises de renom.
eQuest