Conversion de format de données en langage R

Conversion d'une matrice en un
bloc de données Il
est difficile d'utiliser as.data.frame (x) pour convertir un bloc de données en une matrice. S'il existe à la fois un type chaîne et un type numérique, la valeur sera convertie en type chaîne par défaut, et le bloc de données ne peut pas être converti en vecteur. Et les
méthodes factorielles (as) fonctionnent pour tout voir comme. Le
type numérique le plus élémentaire de la fonction R est vecteur, le vecteur peut être converti en plusieurs types de données, par exemple, l'ajout de dimension au vecteur peut être converti en matrice ou en tableau.
Le
Insérez la description de l'image ici
vecteur par exemple est converti en données de type facteur. Le
Insérez la description de l'image ici
vecteur est converti en liste.
Insérez la description de l'image ici
Prenez un sous-ensemble du bloc de données. Vous pouvez utiliser l'index pour extraire en continu ou de manière non continue.
Continu x1 <- x [c (1: 3 ), c (2: 5)] Non-continu x2 <- x [c (1,3,4), c (5,7,9)]
extraction conditionnelle x <- x [qui (x $ nom de colonne == une certaine valeur),] Remarque: N'oubliez pas Ajouter une virgule, deux signes égaux
sont nécessaires pour déterminer l'équation. Vous pouvez également utiliser la fonction de sous-ensemble pour prendre un sous-ensemble. Il est plus pratique d'
échantillonner à partir d'un plus grand ensemble de données dans le domaine de l'exploration de données et de l'apprentissage automatique. Par exemple, vous avez besoin de deux échantillons, l'un utilisé pour modéliser, le modèle utilisé pour vérifier un autre échantillon, l'échantillon peut être utilisé dans l'échantillon aléatoire R, il est facile de définir la taille de l'échantillon , pas de retour des échantillons (chaque numéro ne peut apparaître qu'une seule fois)
pour le châtaignier:
pour l'échantillonnage vectoriel
Insérez la description de l'image ici
Utilisez le même code pour échantillonner la base de données, modifiez le nom de la base de données correspondante et remplacez = T ou F pour représenter l'échantillonnage avec retour et l'échantillonnage sans revenir.

Ensuite, apprenez à supprimer les données d'une ligne fixe:
le moyen le plus simple est d'utiliser un index négatif par exemple x [-1: -3,], mettez la virgule derrière pour supprimer la colonne correspondante, et mettez la virgule avant de supprimer le correspondant ligne.
La deuxième méthode verrouille directement la ligne. Ou colonne, par nom, attribuez NULL

Ajout et fusion de
blocs de données: par exemple, le jeu de données USArrests mesure quatre taux de criminalité dans 50 États des États-Unis.
Ajoutez une colonne, par exemple, au bloc de données.
Insérez la description de l'image ici
Insérez la description de l'image ici
Insérez la description de l'image ici
Vous pouvez également utiliser la fonction cbind pour ajouter une colonne. Il s'agit d'un direct fusion. La méthode ci-dessus consiste à recréer le bloc de données. Formulaire, la fusion de lignes est plus compliquée. Les noms de colonne et de ligne doivent être identiques ou rbind ne peut pas s'exécuter. S'il y a des doublons après la fusion, utilisez la fonction dupliquée pour déterminer quelles valeurs sont des doublons dans la trame de données ou le vecteur, et renvoyez des valeurs logiques, et utilisez l'index pour retirer par exemple x [! Dupliqué (x),] pour prendre les parties non dupliquées. Vous pouvez également utiliser directement la fonction unique pour extraire directement les parties non répétées.

Je suppose que tu aimes

Origine blog.csdn.net/m0_46445293/article/details/105467099
conseillé
Classement