Python utilise la bibliothèque Numpy pour charger les fichiers Numpy (.npy) et inspecter leur contenu

insérer la description de l'image ici

Introduction générale

Pour déterminer le type d'ensemble de données d'un fichier Numpy (.npy), vous pouvez utiliser la bibliothèque Numpy en Python pour charger le fichier et inspecter son contenu. Voici quelques étapes courantes :

  1. Importez la bibliothèque Numpy : Tout d'abord, assurez-vous que la bibliothèque Numpy est installée et importez-la :
import numpy as np
  1. Charger les fichiers Numpy : utilisez np.load()la fonction pour charger les fichiers .npy :
data = np.load('your_file.npy')
  1. Vérifiez les propriétés des données : Une fois le fichier .npy chargé, vous pouvez vérifier les propriétés des données pour déterminer leur type. Voici quelques propriétés courantes et leurs significations :

    • data.dtype: Cela renverra le type de données des données. Par exemple, int32il représente un entier de 32 bits, float64un nombre à virgule flottante de 64 bits et <U5une chaîne Unicode de 5 caractères.
    • data.shape: Cela renverra la forme des données, c'est-à-dire les dimensions des données et la taille de chaque dimension. Par exemple, (100, 3)un tableau 2D de 100 lignes et 3 colonnes (64, 64, 3)représente une image de 64 x 64 pixels avec 3 canaux.
    • data.ndim: Cela renverra le nombre de dimensions des données. Par exemple, 2 représente des données bidimensionnelles, 3 représente des données tridimensionnelles, et ainsi de suite.
    • data.size: Cela renverra le nombre total d'éléments dans les données.
  2. Déterminez le type en fonction des attributs : en fonction des valeurs des attributs ci-dessus, vous pouvez initialement déterminer le type de données dans le fichier .npy. Par exemple, si le type de données est entier et la dimension est 2, il peut s'agir d'une image contenant des valeurs de pixels. Si le type de données est à virgule flottante et que la dimension est 1, il s'agit probablement de données numériques unidimensionnelles.

  3. Visualiser les données (facultatif) : si vous n'êtes pas sûr du type de données, vous pouvez essayer de visualiser les données pour mieux les comprendre. Par exemple, pour les données d'image, vous pouvez utiliser Matplotlib pour afficher l'image. Pour les données numériques, vous pouvez dessiner un histogramme ou un graphique linéaire.

données.dtype

data.dtypeCe qui est renvoyé est le type de données (type de données) des données stockées dans le tableau Numpy. Ce type de données est généralement un objet de type de données Numpy qui représente le type de chaque élément du tableau.

Numpy prend en charge plusieurs types de données. Voici quelques types de données Numpy courants et leurs identifiants correspondants :

  • int32, int64, int16, int8: entiers signés, représentant respectivement des entiers de 32 bits, 64 bits, 16 bits et 8 bits.
  • uint32, uint64, uint16, uint8: entiers non signés, représentant respectivement des entiers non signés de 32 bits, 64 bits, 16 bits et 8 bits.
  • float32, float64: Nombres à virgule flottante, représentant respectivement des nombres à virgule flottante de 32 bits et 64 bits.
  • complex64, complex128: nombres complexes, représentant respectivement des nombres complexes de 64 bits et 128 bits.
  • <U{n}: Chaîne Unicode, où {n} représente le nombre maximum de caractères dans la chaîne.

Par exemple, si un tableau Numpy a un type de données int32, alors les éléments du tableau sont tous des entiers signés de 32 bits. Si le type de données est float64, alors les éléments du tableau sont tous des nombres à virgule flottante double précision de 64 bits.

<U319Représente que le type de données dans un tableau Numpy est une chaîne Unicode, où le nombre maximum de caractères par chaîne est de 319 caractères. Il s'agit d'un type de données Numpy utilisé pour représenter des données texte. Dans ce type de données, chaque élément du tableau est une chaîne Unicode pouvant contenir divers caractères, notamment des lettres, des chiffres, des symboles et des caractères spéciaux.

Par exemple, si vous disposez d'un tableau Numpy de type de données <U319, chaque élément de ce tableau peut contenir jusqu'à 319 caractères de données texte. Vous pouvez utiliser des index pour accéder à des chaînes individuelles dans un tableau et effectuer des opérations de traitement ou d'analyse de texte telles que la recherche, le fractionnement, le remplacement, etc.

Veuillez noter que <U{n}in {n}représente le nombre maximum de caractères dans la chaîne dans ce type de données. Vous pouvez choisir le nombre approprié de caractères pour stocker vos données texte en fonction de vos besoins.

Vous pouvez data.dtypevérifier le type de données d'un tableau Numpy en utilisant

données.forme

data.shapeRenvoie la forme d'un tableau Numpy, c'est-à-dire les dimensions du tableau et la taille de chaque dimension. Il s'agit d'un tuple contenant des informations de taille pour chaque dimension.

Par exemple, si vous disposez d'un tableau Numpy data, vous data.shapepouvez l'utiliser pour obtenir ses informations de forme, sous la forme (n1, n2, n3, ...), où n1, n2, n3etc. représentent la taille de chaque dimension. La longueur de la forme dépend du nombre de dimensions du tableau.

Voici quelques exemples:

  1. Pour un tableau unidimensionnel, la forme sera (n,), où nreprésente la longueur du tableau.

  2. Pour un tableau bidimensionnel (matrice), la forme sera (n1, n2), où n1représente le nombre de lignes et n2représente le nombre de colonnes.

  3. Pour un tableau tridimensionnel, la forme sera (n1, n2, n3).

  4. Pour les tableaux de dimensions supérieures, la forme contiendra un nombre correspondant de tailles de dimension.

Par exemple, si vous disposez d'un (3, 4)tableau de forme Numpy représentant une matrice de 3 lignes et 4 colonnes, data.shapealors (3, 4).

Vous pouvez l'utiliser data.shapepour obtenir des informations sur les dimensions d'un tableau afin de pouvoir comprendre sa structure lors du traitement et de l'analyse des données.

données.personnes

data.ndimRenvoie le nombre de dimensions d'un tableau Numpy, également appelé rang du tableau. Cette valeur vous indique le nombre de dimensions ou d'axes du tableau.

Par exemple, si vous disposez d’un tableau unidimensionnel, data.ndim1 sera renvoyé, indiquant que le tableau est unidimensionnel. Si vous disposez d'une matrice 2D, data.ndim2 sera renvoyé, indiquant que le tableau est 2D, avec des lignes et des colonnes. S'il existe un tableau tridimensionnel, data.ndim3 sera renvoyé, et ainsi de suite.

Le nombre de dimensions est très important pour comprendre et manipuler les tableaux car il détermine le nombre d'index que vous devez utiliser pour accéder aux éléments du tableau. Par exemple, pour un tableau à deux dimensions, vous devez fournir deux indices, un pour spécifier les lignes et un pour les colonnes. Le nombre de dimensions correspond également à la longueur des tuples dans la forme du tableau.

Voici quelques exemples:

  • Tableau unidimensionnel : data.ndimrenvoie 1
  • Tableau à deux dimensions (matrice) : data.ndimrenvoie 2
  • Tableau tridimensionnel : data.ndimretour 3
  • Tableaux de dimensions supérieures : data.ndimrenvoient les valeurs correspondantes

En inspectant data.ndim, vous pouvez déterminer le nombre de dimensions du tableau Numpy avec lequel vous travaillez, ce qui vous aide à manipuler correctement le tableau lors de l'écriture du code.

données.size

data.sizeRenvoie le nombre total d'éléments dans un tableau Numpy. Plus précisément, il représente le nombre d'éléments de données contenus dans le tableau.

Par exemple, si vous avez un (3, 4)tableau de forme Numpy représentant une matrice de 3 lignes et 4 colonnes, alors data.sizesera renvoyé 3 * 4 = 12car le tableau contient un total de 12 éléments.

En cochant data.size, vous pouvez déterminer le nombre d'éléments dans le tableau, ce qui est très utile pour analyser et traiter les données du tableau. Cela peut être utilisé pour parcourir tous les éléments d'un tableau, calculer des statistiques ou vous assurer que vos opérations ne sortent pas des limites.

Je suppose que tu aimes

Origine blog.csdn.net/weixin_74850661/article/details/132795572
conseillé
Classement