Veuillez effectuer un traitement de binarisation sur l'absence de champ de l'ensemble de données. S'il est plus de 8 fois, il est enregistré comme 1, et s'il n'est pas plus de 8 fois, il est enregistré comme 0. Enregistrez le résultat traité comme nouveau colonne new_absence de l'ensemble de données.
Conseil: vous pouvez utiliser la fonction Binarizer dans sklearn.preprocessing pour réaliser les fonctions ci-dessus
import pandas as pd
data = pd.read_csv('newdata.csv')
print(data[['absences']].head())
# 二值化转换
from sklearn import preprocessing
binarizer = preprocessing.Binarizer(threshold=8)
data['new_absences'] = binarizer.transform(data[['absences']])
print(data[['new_absences']].head())