En bref
Avant de construire un tableau de bord turnover ou de lancer un modèle prédictif, une étape est incontournable : préparer et explorer vos données. Valeurs manquantes, variables pertinentes, test du chi2 : découvrez comment structurer l’analyse exploratoire de vos données RH pour identifier les facteurs réels de départ dans votre organisation.
Vous souhaitez comprendre pourquoi mener une analyse du turnover au sein de votre organisation et quelles données sont importantes pour cela ? La première partie de notre étude sur les données à prendre en compte pour analyser le turnover a révélé les différentes facettes de ce phénomène et vous donne les caractéristiques et les variables des employés à prendre en compte.
Plongeons maintenant au cœur de la seconde partie de notre analyse. Durant cette partie, nous allons préparer nos données à l’analyse. Nous allons examiner chaque variable et comprendre son influence sur le départ volontaire de l’employé.
Gardez bien en tête que les noms de variables représentent notre cas d’usage, mais que vous devez les adapter à votre cas.
Pourquoi la préparation des données est l’étape la plus critique :
Dans un projet d’analyse turnover, la tentation est de vouloir passer rapidement aux visualisations et aux insights. C’est une erreur fréquente. Un dashboard construit sur des données mal préparées : valeurs manquantes ignorées, variables non pertinentes incluses, biais non détectés, produira des conclusions erronées et des décisions contre-productives.
La qualité de l’analyse dépend entièrement de la rigueur de cette étape préparatoire. C’est l’un des 5 pièges classiques des projets Data RH que nous détaillons dans notre article dédié.
Préparation des données et analyse exploratoire du turnover
Afin de mieux comprendre les facteurs influençant le turnover au sein de votre organisation, il est essentiel de se pencher sur l’analyse des données RH.
Grâce à l’utilisation d’outils d’analyse de données tels que Python (qui nous servira également dans la suite de l’étude), il est possible d’importer ces données et de préparer notre étude.
Qu’est-ce que l’analyse exploratoire des données ?
L’analyse exploratoire des données (AED) est utilisée pour analyser et étudier les ensembles de données puis résumer leurs principales caractéristiques, à l’aide de méthodes de visualisation ou tests statistiques. Elle permet de mieux comprendre les variables d’un ensemble de données et les relations entre elles, et donc de déterminer la meilleure façon de manipuler des sources de données pour obtenir les réponses dont vous avez besoin.
1ère étape de l’AED : l’analyse des valeurs manquantes
La première chose à faire est de regarder les valeurs manquantes. Ces lacunes peuvent être révélatrices et doivent être traitées avec soin. Nous remarquons que plus de 50 % des données de note de l’employé et de note du manager sont absentes, donc nous décidons d’exclure ces variables. Concernant les autres variables, les valeurs manquantes représentent moins de 4 % du dataset donc nous supprimons simplement les lignes qui y sont associées. Cette manière de raisonner n’est qu’un exemple, mais il est important d’analyser l’impact que peut avoir ce genre de décision sur les résultats finaux.
Qu’est-ce que le chi2 et pourquoi l’utiliser pour analyser ses données en turnover ?
Désormais, nous souhaitons savoir si toutes les variables sélectionnées au départ sont pertinentes dans notre analyse. On va donc appliquer un test statistique d’indépendance du chi2 sur chacune de nos variables individuellement.
On choisit d’utiliser le test du chi2 car c’est un test d’indépendance à utiliser sur des variables catégorielles qui permet de montrer si une variable dépend d’une autre. Ici, on souhaite savoir si une variable exerce une influence sur les départs, donc si les départs sont dépendants d’une variable quelconque. Par exemple, dans notre cas, si on applique le test sur la variable de l’âge, on a vu que ce dernier a une influence sur les départs.
Nous pouvons donc modéliser un tableau contingence :
Ce tableau de contingence nous permet de voir que les départs sont très représentés chez les plus jeunes employés
(0-30 et 31-40 ans) : 42 % + 35 % des départs sont réalisés dans ces tranches d’âges. Ceci n’est pas le résultat final, mais un complément au résultat qui seront visibles ou non sur le dashboard.
Le test du chi2 nous a donc permis de savoir quelles variables exclure de notre étude. Dans notre cas, nous avons déduit que le nombre de mobilités internes et le congé longue durée n’impactent pas les départs, donc nous ne les prendrons pas en compte dans notre étude. Hormis ces dernières, nous utiliserons toutes les autres variables.
Conclusion sur la préparation des données et analyse exploratoire du turnover
En conclusion de cette seconde partie, l’analyse exploratoire des données s’avère être un outil précieux pour décrypter les complexités inhérentes à notre ensemble de données. Il a ainsi été possible d’identifier les variables qui méritent une attention particulière pour les prochaines étapes de l’étude.
Le test du chi2, appliquée de manière systématique à l’ensemble des variables pour une période étendue, permet de constituer un dataset riche et pertinent pour l’étude du turnover.
SQORUS se positionne comme le partenaire de choix pour vous accompagner dans cette démarche, en vous apportant expertise, innovation et accompagnement personnalisé. Contactez-nous dès maintenant pour discuter de vos besoins spécifiques.
Retrouvez dans notre troisième et dernière partie, l’utilisation de PowerBI pour visualiser facilement ces données de turnover et trouver des solutions.
Cet outil permettra de saisir immédiatement les tendances, d’identifier les facteurs de turnover significatifs et de prendre des décisions éclairées pour optimiser la gestion de la masse salariale.
Stratégie Data RH : et si on accélérait ?
Imaginez un monde où la fonction RH est propulsée dans une nouvelle dimension grâce à la puissance de la data. Et si ce monde était à portée de main ? Découvrez comment exploiter tout le potentiel de la Data RH pour révolutionner votre organisation.
Contact
Un projet ? Une demande ? Des questions ?
Contactez-nous dès aujourd’hui et découvrez comment nous pouvons concrétiser ensemble l’avenir du numérique de votre entreprise.
FAQ – Analyse exploratoire des données turnover
Qu'est-ce que l'analyse exploratoire des données (AED) et pourquoi est-elle indispensable ?
L'AED est l'étape préalable à toute modélisation ou visualisation. Elle permet d'évaluer la qualité des données, de comprendre la distribution des variables et d'identifier celles qui sont réellement liées au phénomène étudié, ici, le turnover volontaire. Sans cette étape, le risque est de construire des tableaux de bord sur des données biaisées ou non représentatives, ce qui conduit à de mauvaises décisions.
Pourquoi utiliser le test du chi2 pour analyser le turnover ?
Le test du chi2 est un test statistique d'indépendance adapté aux variables catégorielles (âge, genre, type de contrat, département). Il permet de déterminer si une variable est statistiquement liée aux départs, ou si la relation observée est due au hasard. C'est un filtre rigoureux qui évite d'inclure des variables non pertinentes dans l'analyse finale.
Quels outils utiliser pour préparer une analyse turnover ?
Python (avec les librairies pandas, scipy et matplotlib) est l'outil de référence pour les analyses statistiques avancées. R est une alternative puissante pour les tests statistiques. Pour les équipes RH moins techniques, Power BI ou Tableau permettent de réaliser des visualisations exploratoires accessibles sans compétences en programmation. Le choix dépend de la maturité data de votre organisation et des compétences disponibles en interne.



