projet d'analyse des données combat: analyse des données RH - articles R

A: arrière-plan d'analyse

Lorsque la fin de l'année, l'inventaire Exxon du travail l'année dernière a révélé que le travail de l'entreprise en termes de main-d'œuvre et peu satisfaisante. la performance spécifique est: apparaissent dans des moments importants au cours de l'année et les séparations employés: l'enthousiasme de certains des travaux du personnel n'est pas élevé: La formation du personnel est sous-effectif, menant au développement des affaires lente, partie humaine des employés de comprendre la situation générale est pas en place et ainsi de suite.

En second lieu, les données d'importation et aperçu

## 加载包
library(dplyr)
library(ggplot2)
library(Rmisc)         # multiplot()  分割绘图区域

#导入数据集
data<-read.csv('员工数据.csv')

#查看数据的内容摘要
summary(data)

#展示数据的结构摘要
str(data)

Insérer ici l'image DescriptionInsérer ici l'image Description

#展示部分数据
head(data)

Insérer ici l'image Description
Satisfaction de ce champ existe des valeurs manquantes, la nécessité subséquente pour un nettoyage plus poussé des données;

En troisième lieu, le nettoyage des données et de transformation

Jusqu'à valeur pour la valeur manquante à la moyenne de:

data[is.na(data$员工满意度),'员工满意度']<-mean(data$员工满意度,na.rm = TRUE)
head(data,15)

Insérer ici l'image Description

Conversion de types de données en facteur de type, de faciliter encore l'analyse ultérieure fait

# 将数据类型转换成便于后续分析的类型
data$职位变动<-as.factor(data$职位变动)
data$离职<-as.factor(data$离职)
data$过去5年是否有升职<-as.factor(data$过去5年是否有升职)
str(data)

Insérer ici l'image Description
La durée totale des travaux de projet et employés Moyenne: Création d'une nouvelle variable de fonction (colonne)

# 创建新的特征变量()-总工作时长&员工平均项目数
new.data<-data%>%
  mutate('总工作时长'= 平均每月工作小时 * 12 * 在公司工作年限,'年均项目数' = 项目数/在公司工作年限)%>%
  as.data.frame

# 查看数据
str(new.data)

Insérer ici l'image Description

Quatrièmement, l'analyse exploratoire des données

Lorsque les employés de l'entreprise pour explorer la satisfaction de la relation, l'évaluation de la performance et le chiffre d'affaires mensuel moyen de travail long et si

# 绘制对公司满意度与是否离职的箱线图
box_sat <- ggplot(new.data, aes(x = 离职, y = 员工满意度, fill = 离职)) +
  geom_boxplot() + 
  theme_bw() +  # 一种ggplot的主题
  labs(x = '离职', y = '员工满意度') # 设置横纵坐标标签
box_sat

Insérer ici l'image Description

# 绘制绩效评估与是否离职的箱线图
box_eva <- ggplot(new.data, aes(x = 离职, y = 最后一次绩效评估, fill = 离职)) + 
  geom_boxplot() +
  theme_bw() + 
  labs(x = '离职', y = '最后一次绩效评估')
box_eva

Insérer ici l'image Description

# 绘制平均月工作时长与是否离职的箱线图
box_mon <- ggplot(new.data, aes(x = 离职, y = 平均每月工作小时, fill = 离职)) + 
  geom_boxplot() + 
  theme_bw() + 
  labs(x = '离职', y = '平均每月工作小时')
box_mon

Insérer ici l'image Description

# 绘制员工在公司工作年限与是否离职的箱线图
box_time <- ggplot(new.data, aes(x = 离职, y = 在公司工作年限, fill = 离职)) + 
  geom_boxplot() + 
  theme_bw() + 
  labs(x = '离职', y = '在公司工作年限')
box_time

Insérer ici l'image Description

# 合并这些图形在一个绘图区域,cols = 2的意思就是排版为一行二列
multiplot(box_sat, box_eva, box_mon, box_time, cols = 2)

Insérer ici l'image Description
Résumé:

En explorant un employé de longue date de la satisfaction de l'entreprise, l'évaluation de la performance et le chiffre d'affaires mensuel moyen de travail et si la relation peut être établie dispose d'anciens employés:

  • Société pour abaisser la satisfaction, concentrée principalement autour de 0,4;
  • évaluation de haute performance, plus concentrée à 0,8; (
  • longueur moyenne plus élevé du solde de travail, la plupart du temps un supérieur à la moyenne (200 heures);
  • En quatre ans d'expérience professionnelle

Le nombre de projets d'exploration en cause, il n'y a pas de relation entre la promotion et la rémunération et les congés dans les cinq ans

# 绘制参与项目个数与是否离职的百分比堆积条形图
bar_pro <- ggplot(new.data, aes(x = as.factor(new.data$项目数), fill = 离职)) +
  geom_bar(position = 'fill') + # position = 'fill'即绘制百分比堆积条形图
  theme_bw() + 
  labs(x = '项目数', y = '离职')
bar_pro

Insérer ici l'image Description

# 绘制5年内是否升职与是否离职的百分比堆积条形图
bar_5years <- ggplot(new.data, aes(x = 过去5年是否有升职, fill = 离职)) +
  geom_bar(position = 'fill') + 
  theme_bw() + 
  labs(x = '过去5年是否有升职', y = '离职')
bar_5years

Insérer ici l'image Description

# 绘制薪资与是否离职的百分比堆积条形图
bar_salary <- ggplot(new.data, aes(x = 薪资水平, fill = 离职)) +
  geom_bar(position = 'fill') + 
  theme_bw() + 
  labs(x = '薪资水平', y = '离职')
bar_salary

Insérer ici l'image Description

# 合并这些图形在一个绘图区域,cols = 3的意思就是排版为一行三列
multiplot(bar_pro, bar_5years, bar_salary, cols = 3)

Insérer ici l'image Description
En participant au nombre de projets d'exploration, il n'y a pas de relation entre la promotion et la rémunération et le congé dans les cinq ans, nous pouvons tirer les résultats suivants:

  • Le nombre d'éléments impliqués, plus le plus le taux de rotation du personnel (nombre d'éléments à supprimer un échantillon de 2)
  • Dans les cinq ans, il n'y a pas de promotion du taux de rotation des employés est relativement importante
  • Paie Plus le taux de rotation

Dessin pour la poste et si vous souhaitez laisser un pourcentage de graphique à barres empilées

bar_salary <- ggplot(new.data, aes(x = 职务序列, fill = 离职)) +
  geom_bar(position = 'fill') + 
  theme_bw() + 
  labs(x = '职务序列', y = '离职')
bar_salary

Insérer ici l'image Description
Dans l'ensemble, la proportion de la séquence de rotation des employés de différentes positions à peu près, mais des cours de gestion, la recherche de ces taux de rotation relativement plus faible des positions fondamentales.


Rendu divers boxplot la satisfaction de positions

box_eva <- ggplot(new.data, aes(x = 职务序列, y = 员工满意度, 
                            fill = 职务序列)) + 
  geom_boxplot() +
  theme_bw() + 
  labs(x = '职务序列', y = '员工满意度')
box_eva

Insérer ici l'image Description
Dans l'ensemble, la répartition de la séquence de la satisfaction des employés de différentes positions à peu près, mais des ressources humaines, les employés de la classe Finance a marqué relativement faible.

Tout en explorant les employés du travail total longue relation entre le congé annuel et le nombre d'éléments

# 员工总工作时长
box_total_time <- ggplot(new.data, aes(x = 离职, y = 总工作时长, fill = 离职)) + 
  geom_boxplot() + 
  theme_bw() + 
  labs(x = '离职', y = '总工作时长')
box_total_time

Insérer ici l'image Description

# 年均项目数数分布

box_avg_pro <- ggplot(new.data, aes(x = 离职, y = 年均项目数, fill = 离职)) + 
  geom_boxplot() + 
  theme_bw() + 
  labs(x = '离职', y = '年均项目数')
box_avg_pro 

Insérer ici l'image Description

En cinquième lieu, l'analyse statistique et la modélisation

# 步骤1:生成表格,体现不同年限员工流失率
new.data$离职<-as.integer(new.data$离职) # 转换数据类型为整型
library(dplyr)
data.Turnover <- new.data %>%
  group_by(在公司工作年限) %>%  # 按工作年限进行分组
  arrange(在公司工作年限) %>%   # 按工作年限升序排列
  dplyr::summarise(该年限离职员工数=sum(离职==2), 该年限员工总数=n()) %>%  # 对分组后的工作年限进行离职人数和所有人数的汇总
  mutate(该年限及以上所有员工数=rev(cumsum(rev(该年限员工总数)))) %>%  # 新增列“该年限及该年限以上所有人数”
  mutate(该年限员工流失率=该年限离职员工数/该年限及以上所有员工数) %>%  # 新增列“该年限员工流失率”
  select(在公司工作年限, 该年限离职员工数, 该年限员工总数, 该年限及以上所有员工数, 该年限员工流失率)%>%   # 只保留表格的特定列
  as.data.frame

# 步骤2:将体现不同年限员工流失率的表格可视化,找出流失率最高对应的年限

#install.packages("ggplot2")
library(ggplot2)
g <- ggplot(data.Turnover, aes(在公司工作年限,该年限员工流失率))  # 绘制散点图-流失率与工作年限的关系
g + geom_point() + 
  geom_line() +
  theme_bw()+
  labs(x = "在公司工作年限") +
  labs(y = "该年限员工流失率") +
  labs(title = "员工流失率与工作年限的关系") 

Le taux de rotation le plus élevé était de 5 ans d'expérience professionnelle
Insérer ici l'image Description

# 步骤3:做流失驱动力分析,寻找员工在流失率最高的年份离职的主要因素
data.5year <- new.data %>%
  filter(在公司工作年限 >= '5') %>%  # 筛选工作年限为 5 的数据
  mutate(是否在第五年流失 = ifelse(在公司工作年限=='5' & 离职==2,1,0))  # 新增列“是否在第五年流失”
summary(data.5year)

Insérer ici l'image Description

# 步骤4:线性回归,了解各因素对员工流失的影响

lm_fit <- lm(是否在第五年流失 ~ 项目数+平均每月工作小时+工作事故+过去5年是否有升职+职务序列+薪资水平+职位变动+员工满意度+最后一次绩效评估, data=data.5year)
library("car")
vif(lm_fit) # GVIF 均小于10,不存在共线性的干扰

# 挑选模型输入自变量 
library(olsrr) 

model <- lm(是否在第五年流失 ~ 项目数+平均每月工作小时+工作事故+过去5年是否有升职+职务序列+薪资水平+职位变动+员工满意度+最后一次绩效评估,data= data.5year) 
k <- ols_step_all_possible(model) 
print(k)
k[k$adjr==max(k$adjr),]

Insérer ici l'image Description

# 将调整R2最大的变量输入到线性回归模型
lm_fit <- lm(是否在第五年流失 ~ 项目数+平均每月工作小时+工作事故+过去5年是否有升职+薪资水平+职位变动+员工满意度+最后一次绩效评估, data.5year) 
summary(lm_fit) 

Insérer ici l'image Description
L'analyse du principal facteur de la cinquième année du chiffre d'affaires des employés utilisant une régression linéaire, les résultats de la régression linéaire peut être obtenu comme suit:

Que ce soit dans la cinquième année de perte = 1.31+ 0,76 * Performance Dernière évaluation + 0,30 + 0,10 * * salaires des employés de satisfaction faible + 0,07 + 0,05 * salaires moyen Articles - si les cinq dernières années * 0.11 - 0.11 * accidents du travail il 1-- 0,22 * promu changement de position 1

Insérer ici l'image Description

VI. Conclusions et recommandations Analyse

conclusion:

  • La satisfaction et les salaires corrélées positivement, les salaires ultérieure satisfaction plus élevé, plus le taux de rotation;
  • évaluation de haute performance, la satisfaction des employés est faible, un faible niveau de salaire de rotation du personnel est très facile;
  • Longue longtemps le travail mensuel moyen, supérieur à la moyenne (200 heures) plus facile à un congé;
  • Plus le nombre d'employés impliqués dans le taux de rotation du projet est relativement plus élevé;
  • Travail ans Taux de 4 à -6 de rotation du personnel est relativement élevé.

suggestions:

  • départements RH devraient se concentrer sur le cas de la promotion, la satisfaction et l'évaluation psychologique de haute performance, faible satisfaction des employés, bas niveaux de salaire de cette partie du personnel.
  • Pendant de longues heures de travail, la pression de travail du personnel, ajustement en temps opportun de la charge de travail, des dispositions raisonnables pour le programme de travail;
  • Plus que le nombre d'éléments, cela peut signifier des exigences plus élevées pour le travail du personnel, les chefs de département si un soutien suffisant donné en fonction de la capacité du personnel approprié, mais aussi besoin de se concentrer sur les facteurs;
  • Correspondant à 4--6 ans, les employés clés à accorder plus d'attention, en fonction de la situation réelle, faire les incitations appropriées et la promotion pour accroître la satisfaction des employés, améliorer la rétention de ces employés.
Publié 17 articles originaux · louange gagné 10 · vues 1666

Je suppose que tu aimes

Origine blog.csdn.net/weixin_44976611/article/details/104936420
conseillé
Classement