Stage Data Scientist

Offre ID

45315

Date

3 décembre 2025

Famille d'offre

Recherche & développement

Type of contract

Stage

, De 0 à 6 mois

Pourquoi rejoindre Manitou Group ?

Manitou s’engage résolument envers ses collaborateurs. Avec une approche “One United Team”, nous cultivons à l’échelle internationale un environnement de travail dynamique et orienté résultats. Nous garantissons l’égalité des chances et valorisons la diversité de plus de 6000 employés dans plus de 30 pays (6 principaux sites en France, aux USA, en Inde, en Italie et plus de 30 filiales à travers le monde).

Êtes-vous prêt à relever de nouveaux défis ? Rejoignez-nous et participez à notre succès continu.

Le Groupe MANITOU dispose d’une vaste base documentaire technique . L’accès rapide et précis à ces informations est un enjeu important tant dans les activités de développement produit que pour l’usage futur des produits.

Suite à une phase d’expérimentation approfondie, la faisabilité d’un assistant conversationnel (chatbot) basé sur l’architecture RAG (Retrieval-Augmented Generation) a été validée. Ce prototype permet d’interroger nos documents en langage naturel et d’obtenir des réponses factuelles, générées par un LLM en se basant sur les extraits pertinents, et intègre une interaction vocale (Whisper/Coqui TTS).

Nous recherchons un(e) stagiaire pour rejoindre l’équipe R&D de Recherche Avancée afin de consolider, évaluer, optimiser et étendre ce démonstrateur.

Vos Missions

Sous la supervision de l’équipe, vous prendrez en charge le cycle d’amélioration du pipeline RAG. Vos missions principales seront :

1. Prise en main et consolidation :

Vous approprier les travaux d’expérimentation existants (rapport de capitalisation, code source).
Nettoyer, documenter et structurer la base de code pour mettre en place un environnement de développement stable et reproductible.

2. Évaluation du pipeline :

Définir et mettre en œuvre un framework d’évaluation pertinent (ex: RAGAs, TruLens) pour mesurer objectivement la performance : pertinence des chunks récupérés, fidélité des réponses, temps de latence, etc.
Constituer un jeu de questions/réponses de référence pour les tests.

3. Optimisation fondamentale :

Parsing & Chunking : Ré-évaluer et implémenter les meilleures stratégies (ex: pymupdf4llm, MarkdownHeaderTextSplitter) pour gérer les documents complexes (notamment les tableaux). Comparer l’impact des documents « aplatis » vs. originaux.
Retrieval : Expérimenter pour améliorer la pertinence de la recherche (paramètres FAISS, hybridation sémantique/mots-clés, re-ranking).
Génération : Mener des campagnes de « Prompt Engineering » et évaluer l’impact de différents LLMs locaux (via Ollama) sur la qualité des réponses et les performances.

4. Amélioration de l’Interaction Vocale :

Tester différents modèles et paramètres pour la reconnaissance vocale (Whisper) en environnement bruyant.
Évaluer différentes voix et options pour la synthèse vocale (Coqui TTS), y compris le clonage vocal.

5. Exploration et extensions :

Interface : Développer une interface graphique simple (Streamlit ou Gradio) pour faciliter la démonstration.
Sources : Améliorer la citation précise des sources (document, page) utilisées par le LLM.
Multimodalité : Étudier la faisabilité d’intégrer des modèles multimodaux (ex: LLaVA) pour répondre aux questions portant sur les images et schémas des manuels.

6. Documentation et capitalisation :

Maintenir une documentation technique claire et rédiger un rapport de stage détaillé présentant votre démarche, vos résultats et vos préconisations.

Profil Recherché

Étudiant(e) en dernière année d’école d’ingénieur ou Master 2 (Bac+5) en Informatique.
Spécialisation en Intelligence Artificielle, Data Science ou Traitement du Langage Naturel (NLP).

Compétences techniques nécessaires:

Excellente maîtrise du langage Python et de son écosystème scientifique.
Solide compréhension théorique et pratique du Machine Learning, Deep Learning et NLP (embeddings, LLMs).
Connaissance des concepts de l’architecture RAG.

Compétences souhaitables :

Expérience avec des frameworks comme LangChain.
Connaissance des bases de données vectorielles (ex: FAISS).
Utilisation de LLMs locaux (ex: via Ollama) ou Cloud (API).
Notions en parsing PDF (ex: PyMuPDF) et en interaction vocale (Whisper, Coqui TTS).
Expérience avec Streamlit ou Gradio.

Vous:

Curiosité technique et goût prononcé pour l’expérimentation.
Autonomie, rigueur et capacité à résoudre des problèmes complexes.
Bonnes capacités d’analyse et de synthèse.
Bonne communication (écrite et orale) et anglais technique (lecture de documentation).

Environnement Technique

Vous évoluerez principalement avec les outils suivants :

Langage : Python 3.x
Frameworks IA/RAG : LangChain
LLMs / Embeddings Locaux : Ollama (Llama 3.1, Mistral, bge-m3…)
Vector Store : FAISS
Parsing PDF : PyMuPDF (pymupdf4llm), Unstructured
Voix (STT/TTS) : Whisper (OpenAI), Coqui TTS (xtts_v2)
Outils : Jupyter Notebooks, Docker, Git

Qu’est-ce que MANITOU Group peut vous apporter ?

📅 Poste à pourvoir à compter de: Avril 2026

⏱ Durée : 6 mois

🏆 Rémunération : selon niveau de formation + 🍴 Restaurant d’entreprise + Aiide au logement de 100€ par mois dans le cadre d’un déménagement spécifique au stage

🚗 Prise en charge des transports en commun (50% ou 🚴‍♂️ forfait vélo) + Navette gratuite de la gare d’Ancenis au site de Manitou matin et soir

📍 Accessibilité : Le site est basé à Ancenis (44)

VOUS ÊTES CONVAINCU(E) … 📥 Transmettez directement votre candidature au format PDF (CV et lettre de motivation) en cliquant sur « Postuler« .

Localisation(s)

France - Ancenis

Pour afficher cette carte interactive, vous devez autoriser le service Google Maps.

Autoriser et afficher la carte

Postuler

Pour postuler, veuillez commencer par répondre à ces questions.

« * » indique les champs nécessaires

Facebook

Ce champ n’est utilisé qu’à des fins de validation et devrait rester inchangé.

Prénom*

Nom*

Adresse e-mail*

Saisissez un e-mail Confirmez l’e-mail

Téléphone*

Pays*

Fichiers*

Déposez les fichiers ici ou

Types de fichiers acceptés : pdf, Taille max. des fichiers : 5 MB, Max. des fichiers : 1.

Lettre de motivation

Déposez les fichiers ici ou

Types de fichiers acceptés : pdf, Taille max. des fichiers : 5 MB, Max. des fichiers : 1.

Politique de confidentialité

Note d’information sur la confidentialité des données dans le cadre du recrutement

Conformément au Règlement (UE) 2016/679 sur la protection des données personnelles, entré en vigueur dans l’Union européenne le 25 mai 2018, et de la loi Informatique et libertés du 6 janvier 1978 modifiée en conséquence, le Groupe Manitou, composé de Manitou BF et ses filiales s’engage à protéger les droits des individus.

Le respect de la protection de votre vie privée et de vos données à caractère personnel constitue une priorité pour le Groupe Manitou, et nous y attachons une importance particulière dans tous nos processus. La présente note d’information a pour but de vous informer sur la manière dont vos données personnelles sont traitées lors de la procédure de recrutement, mais aussi des droits dont vous disposez à ce titre.

Qui sont les responsables de traitement de vos données personnelles ?

Notre site de recrutement permet de consulter les offres d’emploi des différentes sociétés et filiales du Groupe Manitou. MANITOU BF et ses filiales pourront traiter, en tant que responsable de traitement et sous sa propre responsabilité, ou conjointement, le cas échéant par Manitou BF, les données ainsi collectées à l’issue de votre candidature.

Quelles données vous concernant sont collectées par le Groupe Manitou ?

En cas de candidature dans une des sociétés du Groupe Manitou, les données personnelles traitées par ces dernières ne peuvent être que celles nécessaires au recrutement. Les principales catégories de données personnelles traitées sont ainsi :

votre identité, notamment l’état civil, l’adresse postale et email, le numéro de téléphone, etc.
des données d’ordre économique et financières, telle que la rémunération souhaitée
votre expérience professionnelle
votre parcours de formation (CV, lettre de motivation, etc.)
vos données d’évaluation (résultats des entretiens vidéo, tests, etc.)
les images et vidéos
vos références aux réseaux sociaux
vos données de connexion, telles que l’utilisateur ou compte, le mot de passe et le registre de connexion.

Quelles sont les finalités du traitement de vos données personnelles ?

Les sociétés du Groupe Manitou peuvent traiter vos données pour les finalités suivantes :

Gestion du recrutement :
- Gérer votre profil de candidat, vos candidatures ainsi que vos échanges avec le Groupe Manitou ;
- Garantir la sélection des candidatures en vérifiant l'adéquation de votre profil avec les postes à pourvoir ;
- Remarque : Afin de sélectionner les profils les plus adaptés aux différents emplois, nous avons recours à un logiciel de tri basé sur des algorithmes qui produisent des décisions individuelles automatisées. Dans ce cadre, vous avez la faculté de demander l’intervention d’un humain, d’exprimer votre point de vue vis-à-vis de la décision et de la contester. Pour exercer ces droits, reportez-vous à la section "Quels sont vos droits et comment les exercer ?”
Évaluation du candidat : Afin de déterminer vos compétences professionnelles requises pour le poste, il est possible que l’on vous demande de participer à des évaluations, des tests et entretiens (physiques ou en vidéo).

Gestion de l’accès du candidat :
- Accès personnel sécurisé ;
- Support pour le traitement des erreurs.
Amélioration expérience candidat : Vos données à caractère personnel peuvent être utilisées afin d’assurer le suivi de la qualité et l’amélioration constante de nos produits et services.

Marketing d’embauche : Envoi aux candidats de communications sur des postes potentiels, selon leur pertinence.

Conformité légale : Nous utilisons vos données à caractère personnel pour nous conformer à nos obligations légales, y compris en réponse à une autorité ou une décision judiciaire ou une demande de communication préalable.

Si votre candidature est retenue, il est possible que d’autres informations relatives à vos données personnelles vous soient demandées, qui seront nécessaires à la rédaction de votre contrat de travail avec une société du Groupe Manitou.

Pourquoi sommes-nous autorisés à traiter vos données personnelles ?

Pour traiter vos données personnelles, les sociétés du Groupe Manitou ont besoin d’une base licite. A cet effet, vos données personnelles sont traitées conformément aux dispositions suivantes :

La base de votre consentement : Le traitement de votre candidature dans l’une des sociétés ou filiales du Groupe Manitou nécessite votre consentement explicite. C’est sur la base de ce consentement que sont traitées vos données personnelles.

Le respect des obligations légales ou réglementaires : Les sociétés du Groupe Manitou traitent vos données personnelles lorsque la législation l’exige et ce dans le but de se conformer aux lois locales sur l’emploi et aux réglementations sur la sécurité nationale.

Qui peut avoir accès à vos données ?

Les personnes autorisées impliquées dans le processus de recrutement travaillant pour ou pour le compte des sociétés et filiales du Groupe Manitou ;

Les personnes habilitées des sociétés et filiales du Groupe Manitou, aux fins définies dans la présente charte de confidentialité ;

Les prestataires informatiques travaillant ou effectuant l’assistance sur nos systèmes

Les autorités judiciaires ou administratives lorsque cela est nécessaire pour nous conformer au droit en vigueur.

Transférons-nous vos données personnelles ?

Le Data Center du Groupe Manitou est basé en France. Pour certains services que nous proposons (notamment ceux accessibles par le web), nous faisons appel à des partenaires spécialisés (considérés comme des sous-traitants) et pouvant héberger des données hors de France et de l’Union Européenne. A titre d’exemple, nous avons recours à des partenaires tels que des prestataires informatiques, fournisseurs de réseaux sociaux, agences de marketing.

Combien de temps seront conservées vos données à caractère personnel ?

Vos données à caractère personnel sont conservées aussi longtemps que cela est nécessaire à l’accomplissement des finalités, conformément aux obligations légales ou réglementaires ainsi qu’aux procédures internes.

Dans ce cadre, vos données à caractère personnel sont traitées pendant un maximum de douze mois après la dernière utilisation de votre compte de candidat.

Dans les sociétés françaises du Groupe Manitou, les données à caractère personnel sont archivées pendant un maximum de cinq ans à compter de la dernière utilisation de votre compte candidat.

En cas de litige, les sociétés et filiales du Groupe Manitou peuvent conserver les données à caractère personnel jusqu’à la fin des procédures judiciaires.

Sécurité

Au regard de la nature des données personnelles et des risques que présentent les traitements, le Groupe Manitou met en place des mesures de sécurité d’ordre technique et organisationnel dans le but de préserver la sécurité et la confidentialité des données placées sous notre surveillance et ce contre la manipulation, la perte, la destruction, accidentelles ou intentionnelles, et contre l’accès à ces données par des personnes non autorisées.

Nos procédures de sécurité sont améliorées en permanence au fur et à mesure de l’apparition de nouvelles technologies.

Quels sont vos droits et comment les exercer ?

Vous bénéficiez de plusieurs droits concernant la protection de vos données personnelles :

Droit d’information : Dans l’objectif de garantir un traitement équitable et transparent, vous pouvez recevoir des sociétés du Groupe Manitou toute information concernant les traitements de vos données personnelles.

Droit d’accès et de rectification : Vous avez le droit de demander à accéder à vos données personnelles ainsi que de rectifier les données inexactes. Au titre de ce droit d’accès, vous pouvez avoir la confirmation que des données personnelles vous concernant sont, ou non, traitées et lorsque c’est le cas y avoir accès.

Droit à l'effacement et droit à l’oubli : Vous avez la possibilité d’obtenir l’effacement de vos données personnelles dans certains cas, comme par exemple lorsque les données personnelles ne sont plus nécessaires au regard des finalités pour lesquelles elles ont été collectées. Néanmoins, ce droit à l’oubli est limité au regard des obligations légales et contractuelles des sociétés et filiales du Groupe Manitou.

Droit à l’arrêt de traitement de vos données : Vous avez le droit de limiter le traitement par le Groupe Manitou de vos données à caractère personnel, par exemple lorsque ce traitement est illicite, et de vous y opposer en demandant la suppression de vos données à caractère personnel. Dans ces cas, vos données à caractère personnel ne seront traitées qu’avec votre consentement ou pour l’exercice ou la défense d’un droit en justice.

Droit à la portabilité : Dans le respect des conditions définies par la loi certaines, vous avez le droit de recevoir les données à caractère personnel que vous nous avez fournis, dans un format informatique structuré, couramment utilisé, et de les transmettre à un autre responsable de traitement.

Droit d’opposition et de retrait du consentement : Vous avez le droit de vous opposer au traitement de vos données personnelles pour une raison légitime à tout moment. Vous pouvez également retirer votre consentement à tout moment. Toutefois, il est à noter que si vous vous opposez au traitement de vos données à caractère personnel, nous ne serons pas en mesure de traiter votre candidature.

Pour exercer ces droits, vous pouvez nous contacter, en justifiant de votre identité, par email à l’adresse suivante : privacy@manitou-group.com.

Si les réponses apportées ne vous satisfont pas, vous disposez d’un droit d'introduire une réclamation auprès de la CNIL au sujet du traitement de vos données personnelles.

CNIL: www.cnil.fr

Modification de la présente note d’information

Nous pouvons être amenés à mettre à jour cette note afin qu’elle reflète l’évolution de nos pratiques et de nos services et pour qu’elle reste conforme aux lois et règlements sur la protection des données. Lorsque cela est nécessaire ou requis, nous vous informerons par quelques moyens que ce soit et/ou solliciterons votre accord.

Nous vous invitons donc à la consulter lors de chaque visite afin de prendre connaissance de sa dernière version.