Remote
Job description
Rejoignez tether, une start‑up technologique en pleine expansion spécialisée dans les modèles d’intelligence artificielle de nouvelle génération. En tant qu’Ingénieur Recherche IA au sein de notre équipe « Modèles IA », vous serez au cœur de la conception, du développement et de l’optimisation de modèles de langage à grande échelle (LLM) et de systèmes multimodaux. Vous travaillerez sur des infrastructures de calcul massives, composées de milliers de GPU NVIDIA, afin d’entraîner des modèles de plusieurs milliards de paramètres.
**Missions principales**
- Concevoir et implémenter des architectures de réseaux de neurones innovantes, adaptées à des tailles de modèles variées (de quelques millions à plusieurs dizaines de milliards de paramètres).
- Piloter le pré‑entraînement des LLM en assurant la qualité et la pertinence des jeux de données (curation, filtrage, annotation).
- Optimiser les pipelines d’entraînement distribué : parallélisation de données et de modèles, gestion de la mémoire GPU, réduction des goulots d’étranglement réseau et I/O.
- Mettre en place des stratégies de renforcement des bases de référence (benchmarking, évaluation continue) pour mesurer les gains de performance et d’efficacité énergétique.
- Collaborer étroitement avec les équipes produit, data‑science et infra‑structure pour transformer les prototypes de recherche en solutions déployables à l’échelle industrielle.
- Rédiger des rapports techniques, publier des articles scientifiques et présenter les résultats lors de conférences internationales.
**Profil recherché**
- Diplôme d’ingénieur ou master en informatique, IA, mathématiques appliquées ou domaine équivalent ; un doctorat est un atout.
- Minimum 5 ans d’expérience professionnelle en recherche appliquée ou en ingénierie IA, idéalement sur des projets de pré‑entraînement de LLM ou de modèles multimodaux.
- Maîtrise avancée de Python et des frameworks de deep learning (PyTorch, TensorFlow).
- Solide expérience en calcul haute performance (HPC) : programmation CUDA, utilisation de clusters GPU, orchestration avec Slurm ou Kubernetes.
- Connaissances approfondies des techniques de data‑curation, de tokenisation, de fine‑tuning et de distillation de modèles.
- Capacité à diagnostiquer et résoudre des problèmes de scalabilité, de latence et de consommation énergétique.
- Bonnes pratiques de développement logiciel : versionning Git, CI/CD, tests unitaires, documentation.
- Anglais courant (lecture et rédaction technique) ; le français est un plus.
**Ce que nous offrons**
- Un poste 100 % remote avec une flexibilité totale d’organisation du temps de travail.
- Accès à une infrastructure de pointe (clusters GPU NVIDIA A100/A6000, stockage haute‑performance).
- Un environnement de travail stimulant, orienté recherche et innovation, avec des collègues passionnés et internationaux.
- Budget dédié à la formation continue (conférences, cours en ligne, certifications).
- Rémunération compétitive, bonus basé sur les performances et participation aux succès de l’entreprise.
- Possibilité d’influencer la roadmap produit et de voir vos travaux intégrés dans des solutions commerciales à fort impact.
Si vous êtes animé par la volonté de repousser les limites de l’IA et que vous cherchez un défi technique de haut niveau dans un cadre totalement flexible, postulez dès maintenant et contribuez à façonner l’avenir de l’intelligence artificielle chez tether.