STAGE – Système de recommandation (Machine Learning, Deep Learning, Ethique)

Paris - Stage fin d'études Concevoir des modèles de recommandations issus de l’état de l’art, et développer un démonstrateur fonctionnel. L’

Paris – Stage fin d’études

Concevoir des modèles de recommandations issus de l’état de l’art, et développer un démonstrateur fonctionnel.

L’avènement des technologies Big Data et de l’Intelligence Artificielle représente un terreau fertile pour l’innovation et la démocratisation de ces technologies. Cela s’est accompagné de l’adaptation des structures (entreprises) et des méthodologies aux exigences d’échelle et de temps réel de ces innovations.

Ces dernières années, ce terreau fertile est principalement exploité par les startups qui sont intrinsèquement adaptées, du fait de leur flexibilité et leur imprégnation de ces nouvelles technologies. Cependant, les grandes entreprises structurent elles aussi des hubs d’innovation ou des « Labs » afin de se démarquer et d’exploiter pleinement ces nouvelles technologies.

HeadMind Partners AI & Blockchain s’inscrit dans cette lignée en proposant des solutions complètes, partant de l’identification du use cases au développement de la solution et son déploiement. Ces solutions sont basées sur du Machine Learning et l’IA articulés sur des architectures flexibles, modulaires et scalables.

Les systèmes de recommandation sont en plein essor dans différents domaines (films, livres, produits d’e-commerce …) afin de garantir la meilleure expérience utilisateur sur une plateforme dédiée. Le développement des méthodes ML et Deep Learning continuent d’améliorer les performances de collaborative filtering permettant de rassembler les utilisateurs avec les mêmes affinités sur les produits.

HeadMind Partners AI & Bockchain s’intéresse au développement d’une solution de Recommandation system sur une large quantité de données d’utilisateurs et produits d’une plateforme de e-commerce, nécessitant le recours aux outils relatifs au Big Data (PySpark). HM AI & Blockchain ambitionne de réaliser un état de l’art complet des méthodes existantes, d’expérimenter les dernières publications state-of-the-art en matière de système de recommandation (GANMF, CFGAN…) et de les transposer à des cas d’usage client. Le contrôle de l’éthique des prédictions du moteur de recommandation est également un point clé de l’expérimentation.

Quelques use-cases concrets :

  • Le client, le Bon Coin, dispose de millions de retours utilisateurs (commentaires, notations) sur plus de 100 000 produits, de 2015 à 2020. Il souhaite mettre à jour son moteur de recommandation désormais obsolète, et proposer une note de pertinence des produits proposés aux utilisateurs. De plus, le client souhaite utiliser les méta-données du produit pour améliorer le moteur (commentaire, date du commentaire, activité de l’utilisateur …).
  • Le client, une agence de recrutement, observe des biais dans les propositions de son moteur de recommandation. Les hommes sont en effet favorisés dans les propositions du moteur de recommandation pour un poste d’ingénieur construction. Le client recherche alors des méthodes de correction de ce biais afin de garantir l’égalité des chances des candidats avec les profils.

Vos Missions

L’objectif de votre stage est de proposer des modèles de recommandations issus de l’état de l’art, et de développer un démonstrateur fonctionnel. Vous devrez également proposer des applications dans des contextes client. Dans le détail, vous devrez :

  • Effectuer une veille scientifique afin de déterminer les algorithmes state of the art concernant cette tâche.
  • Tester ces modèles sur les datasets produits (Amazon Product Data, MovieLens) et alimenter la base de données avec des nouvelles features/méta-données.
  • Déterminer les métriques les plus pertinentes permettant d’évaluer les performances de vos modèles.
  • Gérer un gros volume de données utilisateurs sur des Clusters Spark (Databricks)
  • Etudier l’éthique des prédictions des moteurs de recommandation, et implémenter des améliorations
  • Rédiger un rapport détaillé de votre travail, et développer un démonstrateur avec une interface graphique simple (Streamlit, FastAPI …)

Votre profil

Etudiant(e) en dernière année d’une Grande Ecole d’ingénieur ou d’une Université en Mathématiques Appliquées, Statistique ou Informatique (Bac+5 ou PhD) avec une spécialisation en Data science. Vous justifiez d’une première expérience en tant que Data Scientist, éventuellement acquise lors de votre stage de fin d’études.

A cette occasion vous avez développé une ou plusieurs des compétences suivantes :

  • Machine Learning, Deep learning (image et son), Analyse sémantique, Optimisation sous contraintes, Analyse en séries temporelles …
  • Analyses qualitatives et quantitatives
  • Participation à l’industrialisation de solution IA
  • Introduction Cloud et au ML-Ops
  • Démocratiser la mise à disposition client des traitements et algorithmes prédictifs
  • Maîtriser l’univers client pour spécialiser les applications data
  • Résolution de problèmes complexes
  • Elaborer des préconisations, proposer des solutions et scénarii d’amélioration
  • Veille technologique et analyse

Outils informatiques utilisés (logiciels) :

  • Python
  • Scikit-learn, TensorFlow / Pytorch
  • Infrastructure de calcul: serveur + GPU (data Lab)
  • PySpark, SQL
  • DevOps (Docker)
  • Outils et méthodologie projet (Trello, Agile, Jira)
  • Data Visualisation

Vous faites preuve de rigueur scientifique, d’autonomie et d’un fort esprit d’équipe.

Doté d’une bonne expression orale et écrite, vous avez développé une réelle capacité de vulgarisation des sujets techniquement complexes et vous souhaitez évoluer au sein d’un environnement innovant et dynamique ?

Les atouts de HeadMind Partners :

Fondé sur l’innovation et l’expertise, HeadMind Partners est un cabinet de conseil spécialisé en Intelligence Artificielle & Blockchain.

Notre spécificité ? Couvrir toutes les problématiques marché de valorisation de la donnée en entreprise.

Nos atouts :

  • Une forte expertise en Intelligence Artificielle et en Cybersécurité,
  • Une méthodologie adaptée à l’Intelligence Artificielle & un fonctionnement en mode projet
  • Des solutions clés en main appliquées (Boîte à outils IA),
  • Un pilotage de nos compétences sous forme matricielle pour garantir un niveau d’expertises élevé de nos consultants
  • Des formations métiers & des participations à des challenges IA
  • Des partenariats technologiques (GCP, IRT) pour tester les méthodes
  • Des missions stratégiques et à haute valeur ajoutée auprès de Clients Grands Comptes (Entreprises du CAC 40 & du SBF 120).
  • Des équipes portées par 3 engagements forts : un encadrement bienveillant, un apprentissage permanent, des opportunités de développement.
  • Un environnement professionnel certifié ISO 27001 & ISO 9001:2015 pour l’entité Cyber Risk & Security, labellisé Ecovadis et reconnu par ses salariés, stagiaires et candidats (labels Happy at Work, Trainees & Candidates).

Leave a Reply