Notes d'étude (01): combat de nettoyage de données Python - Cours d'introduction

Apprendre immédiatement: https://edu.csdn.net/course/play/26990/361139?utm_source=blogtoedu

nettoyage des données;
numpy, PANDAS;

Grandes lignes:

Des outils communs (numpy, pandas géants de la série, dataframe)

Opérations sur les fichiers (csv, Excel, MySQL)

traitement de table de données (filtrage, des additions et des deletions, tri)

Conversion de données (chaîne, date, conversion de format)

Statistiques (groupby de paquets, des fonctions d'agrégation, la fonction appliquer)

prétraiter les données (valeurs en double, les valeurs par défaut, les valeurs aberrantes, des données discrètes)

 

Il nécessite des problèmes de nettoyage des données;

1. Données manquantes - l'espace de valeur d'attribut;

2. Le bruit - valeurs de données déraisonnables;

3. incompatibles - il y a une contradiction et des données;

4. La redondance des données - données d'attributs de deux ou plus que le nombre d'analyses de données requises;

Les points discrets / valeur aberrante

6. Les données répétées

 

Publié 73 articles originaux · louange gagné 24 · vues 2555

Je suppose que tu aimes

Origine blog.csdn.net/weixin_44943394/article/details/105063460
conseillé
Classement