Cas d’usage : optimiser la recommandation de contenus avec l’intelligence artificielle

Linkedin logo

Rédigé par Constance FROMONOT

Publié le 28 janvier 2025

Cet article a été rédigé par Constance, FROMONOT, Consultante Data confirmée chez SQORUS, avec la contribution de Mahmoud, Consultant IT & Data, qui ont tous deux piloté ce projet innovant de système de recommandation.

Explorez les possibilités de l’intelligence artificielle (IA) dans le domaine des recommandations. Notre dernier projet vise à transformer une application de veille technologique interne grâce à l’intégration d’un système de recommandation.

Découvrez comment notre expertise a donné naissance à un POC (preuve de concept) réussi, exploitant le jeu de données MovieLens pour façonner un système de recommandation robuste, basé sur les préférences des collaborateurs.

L’application de l’intelligence artificielle à la recommandation de contenu ne cesse de croître en 2024. Parmi les plus connus on y trouve ceux de Netflix pour vous recommander des séries/ films, ou celui d’Amazon pour vous recommander des produits que vous serez susceptibles d’acheter.

Mais les applications ne se limitent pas à des usages commerciaux. Dans notre POC, nous souhaitons développer un algorithme de recommandation pour un outil interne, permettant aux collaborateurs de faire une veille efficace et proactive dans leurs différents domaines.

Le projet s’est déroulé en 5 phases distinctes.

1. Choix, définition et extraction des données

Ne disposant pas d’une base de données préexistante, nous avons réalisé un POC d’un système de recommandation en utilisant l’ensemble de données du jeu de données MovieLens disponible en ligne. Nous avons choisi cet ensemble de données en raison de ses similitudes avec notre future base de données (genre des éléments, interactions utilisateur-élément, date, plusieurs tables…etc).

Cette première étape a nécessité une compréhension approfondie des variables, créant ainsi une base solide pour le reste du projet.

2. Expression des hypothèses

Notre approche s’est articulée autour de 3 types de recommandations qui ont chacune leurs hypothèses :

Hypothèse Content Based Filtering  : On considère que les utilisateurs sont plus susceptibles d’apprécier des films présentant des caractéristiques similaires à ceux qu’ils ont évalués positivement par le passé.

Hypothèse Collaborative Filtering : On suppose qu’un utilisateur n’a pas regardé un film s’il n’a pas attribué de note au film.

Hypothèse Distance de Levenshtein : On suppose que des films avec des titres similaires, même s’il y a de légères différences ou des fautes d’orthographe, partagent des similitudes de contenu.

3. Analyse exploratoire

Les données réelles, bien que riches en informations, ont nécessité un traitement des valeurs manquantes et une modélisation pour obtenir le jeux de donnée nécessaire à notre étude. Ce dernier est basé sur les 6 tables que comporte le jeu de données MovieLens.

Nous obtenons le jeux de données final suivant : 20 000 263 notes données par un utilisateur à un film, 1342 genres de films.

Pour approfondir le sujet de la Data Science et son impact sur les fonctions de l’entreprise, notamment dans le domaine RH et de la formation, nous vous invitons à consulter notre article dédié sur la révolution de la Data Science dans les fonctions RH.

4. Modélisation et évaluation

Dans cette partie, nous avons tenu compte des 3 types de recommandations définis précédemment :

Content based filtering

Le principe de cet algorithme repose sur la recommandation de films aux utilisateurs en fonction des caractéristiques des films (le genre) et des préférences de l’utilisateur.

Nous avons exploré les genres, en les convertissant en une représentation numérique à l’aide de TF-IDF (Term Frequency-Inverse Document Frequency). Ce dernier fonctionne en attribuant des poids aux termes en fonction de leur fréquence dans un document (fréquence des termes) et de leur rareté dans l’ensemble des documents (fréquence inverse des documents).

Dans notre cas, TF-IDF transforme les genres de films en une matrice, capturant l’importance de chaque genre dans la description du contenu d’un film.

Le système de recommandation utilise ensuite cette matrice pour trouver des films similaires en se basant sur les genres et le contenu du film.

De plus, le code filtre et trie efficacement la liste des films similaires, garantissant que les recommandations fournies sont pertinentes et classées en fonction de leurs scores de similarité.

Collaborative filtering

 

Le filtrage collaboratif est une méthode permettant d’anticiper les films susceptibles de plaire à un utilisateur en se fondant sur les réactions d’autres utilisateurs partageant des préférences similaires. Ces types de modèles sont très efficaces pour fournir du contenu personnalisé tout en étant capables de s’adapter aux préférences changeantes des utilisateurs.

Pour mettre en œuvre notre filtrage collaboratif, nous opterons pour la méthode des k plus proches voisins. Le processus débutera par la création d’une matrice fondée sur nos données, englobant les réactions fournies par un groupe d’utilisateurs à des éléments spécifiques d’un ensemble de films.

Ensuite, pour évaluer la similitude entre deux utilisateurs, nous mesurerons la distance entre les évaluations qu’ils ont attribuées aux films partagés.

Ces évaluations de chaque utilisateur sont considérées comme des vecteurs dans un espace multidimensionnel, chaque dimension représentant un film. Une fois que les similarités ont été calculées pour un utilisateur cible (celui pour lequel une recommandation est souhaitée) avec l’ensemble des autres utilisateurs, nous sélectionnons un groupe d’utilisateurs similaires constituant un voisinage.

Ce choix est basé sur un nombre prédéfini de voisins les plus proches, un paramètre ajustable en fonction des besoins fonctionnels.

Distance de Levenshtein

 

Nous utiliserons la distance de Levenshtein pour identifier des éléments étroitement liés lorsqu’un utilisateur de l’application ne recherche pas le nom exact de l’article dans la barre de recherche.

Ici, il s’agit seulement de récupérer tous les titres distincts de films et de mesurer la distance entre chacun de ces titres.

Conclusion d’un système de recommandation

Ce POC combine différents types de recommandations, ce qui lui permet d’atteindre une approche équilibrée et efficace, répondant à des scénarios et des préférences d’utilisateurs diversifiés.

Avec la même approche, il vous est possible de recommander non seulement du contenu à des clients, mais aussi des formations à des collaborateurs ou même des emplois à des collaborateurs dans le cadre de mobilités internes ou externes.

Si vous souhaitez également tirer parti des avantages de l’intelligence artificielle pour de la recommandation ou tout autre sujet, nous pouvons vous accompagner dans cette démarche.

Contactez-nous dès maintenant pour discuter de la manière dont SQORUS peut vous guider dans l’intégration de ces solutions innovantes dans le cadre de votre stratégie.

    Stratégie Data RH : et si on accélérait ?

    Imaginez un monde où la fonction RH est propulsée dans une nouvelle dimension grâce à la puissance de la data. Et si ce monde était à portée de main ? Découvrez comment exploiter tout le potentiel de la Data RH pour révolutionner votre organisation.

    Contact

    Un projet ? Une demande ?
 Des questions ?

    Contactez-nous dès aujourd’hui et découvrez comment nous pouvons concrétiser ensemble l’avenir du numérique de votre entreprise.

    Articles complémentaires

    Parcours - Onboarding SQORUS

    Pour ne rien rater, inscrivez-vous à notre newsletter !

    Notre mission

    Découvrez les forces de la stratégie SQORUS

    Nous avons su nous adapter aux nouveaux enjeux digitaux, à l’arrivée du Cloud et aux évolutions des modes de travail. Nous avons réussi à tisser des partenariats forts avec les principaux éditeurs du marché et à attirer des experts métiers et techniques.

    Notre force : nos plus de 300 talents dédiés à la réussite de vos projets et partageant des valeurs fortes : la diversité, l’engagement et la solidarité, qui constituent une réelle valeur pour l’entreprise et ses clients.

    Great Place to Work depuis 10 années consécutives, SQORUS est sensible à l’épanouissement de ses Sqorusien.ne.s, à leur évolution de carrière et à leur formation sur des solutions d’avenir.

    SQORUS est un cabinet spécialisé dans la transformation digitale et métiers des fonctions RH, Finance et IT. Nos consultants interviennent depuis plus de 30 ans auprès de grandes entreprises sur des projets stratégiques, à dimension internationale, autour des systèmes d’information : stratégie d’évolution, aide au choix, intégration, Business Intelligence, Data Management, support et conduite du changement, mais également sur des enjeux autour du Cloud et de l’Intelligence Artificielle.