python pandas库常用函数及常用代码

python pandas库常用函数

Python中的 pandas库是 Python中的一个模块,主要用于处理、分析数据。可以说 pandas是 Python的一大支柱,而 pandas库的函数也是非常多的。 在 pandas库中有很多函数,这些函数都是一些常用的函数,而且这些函数的功能也很强大。使用这些函数可以很快的完成一些工作,也可以避免不必要的错误。下面我们来看看这些常用函数吧! pandas中比较常用的几个函数:

  • 一、随机数

    随机数是 Python中最常用的函数之一,它的功能就是通过计算一个数字在某个范围内出现的概率来生成一个随机数。其中最常见的随机数就是 srandom,它主要是用于统计数据的分布。 srandom函数的使用方法: srandom函数实际上是一个简单的字符串匹配函数,它使用一个字符串来作为参数,返回一个随机数,可以使用 srandom和 salt两个函数来产生。下面我们通过一个简单的例子来看看该函数如何进行处理: 上面这个例子主要是为了说明 pandas中的 srandom函数的用法,我们只需要简单地根据需要来选择合适的参数就可以了。下面我们看看该函数是如何计算一个随机数:

  • 二、数值和字符串

    pandas中有很多字符串函数,其中使用频率最高的就是 struct ()和 data ()函数。下面我们来看一下这两个函数的用法。 struct ():主要用于创建字符串,比如你要创建一个名为" runtime"的字符串,你可以使用 struct ()函数来创建。 data ():主要用于记录数据,比如你要记录一个月的数据,可以使用 data ()函数来实现。 在使用字符串和数值函数的时候需要注意: 1、字符串:只能包含两个参数,也不能为字符或者数值,参数可以是一个变量。 2、数值:可以是一个变量或者数组。 3、字符串的长度是由字符串的类型决定的,比如" run"这个字符串它的长度是30," yes"这个字符串它的长度就是2。而在 Python中有两种类型的变量,一种是整型,另一种是浮点型。 4、字符串必须要有分号(-),并且一个变量只能有一个引用。比如你想计算年龄,你只能使用 runtime函数来创建一个名为“年龄”的变量。

  • 三、日期

    在 pandas中,日期函数有两种,一种是 date ()函数,另一种是 date (date)函数。date ()函数的用法:该函数将日期转换成数字,然后用 date ()函数的格式存储到一个数组中,再用这个数组计算出日期的具体数值。具体的代码如下: date ()函数的第二个参数是一个字符串,其中包含一个数字和一个日期。在该字符串中可以输入或输出日期信息。在 Python中,要将 date ()函数转换为日期,需要使用 date ()函数。 date ()函数一样都是用来对时间进行计算的,但是在 Python中使用起来还是有些不同。

  • 四、字符串处理函数

    字符串处理函数是 Python中用于字符串的处理函数,这些函数可以帮助我们很快的处理字符串,下面是一些常用的字符串处理函数: 其中 numpy和 matplotlib是 matplotlib库中的字符串处理函数。 matplotlib主要用于对字符串进行统计、转换等操作,如下面这个例子: 其中 numpy可以用来对字符串进行转换,比如将一个文本转换为数字,或者将一个数字转换为文本等等。matplotlib可以用来对字符串进行统计,比如统计一个数字的频率、百分比、出现频率等。 这些都是一些常用的字符串处理函数,我们可以根据需要选择使用。不过这些函数有些地方还是有一些限制的,我们在使用时一定要注意。

  • 五、字典

    在 pandas中可以使用 text函数来查找数据集的每一个元素。如果找不到,那么就返回 false。 1、只可以使用单引号来引用数据集的元素,例如[1,2,3]这三个元素是不能使用引号来引用的,要想使用引号引用,可以将这三个元素转换成一个整数。 2、在查找某一个元素的时候,必须要先找到这个元素在哪个字典中。 3、如果要查找某一个字段的数据集,则可以将这个数据集转换成字典中的元素。例如[1,2,3]这个数据集是可以用字典中的第一个字段来表示的。 4、如果不确定是不是想要查找的数据集中有某一个元素,则可以使用 sort函数来查找。

  • 六、统计数据

    统计数据是指对数据进行分类或者预测,也就是对数据进行分类或者预测。这类问题比较简单,下面我们就来看看一些统计数据的常用函数。 1、分类:可以将一组数据分成两类,分别是数据和标签,也可以将一组数据分成多个类别。 2、预测:对一个变量进行预测,例如,如果一个变量在统计时间内的平均值是6,那么就可以使用该函数对时间进行预测。 3、回归:可以根据给定的条件建立一组数学模型来描述一个变量的变化。 4、聚类:可以将一个组中的数据分成不同的类。 5、多分类:将一组数据分成两个或更多类别的算法。例如,将一组数据分为3个类别(a,b)和3个类别(c,d)。 6、散点图:可以用于分析不同类别的人数多少以及他们在每个类别中所占的百分比。 7、排序:可以根据一定的条件对多个列进行排序,如按字母顺序或按数值大小等。

  • 七、数值转换函数

    pandas中有一个叫做 float的函数,可以将数值转换为浮点数。这个函数的使用方式是这样的: float (int):输出值是整数,输出结果为浮点数。 注意:输出值为浮点数时,需要用 float ()函数进行转换。需要注意的是,在 Python中, float ()函数没有返回一个浮点数,而是返回一个整数。 Python中可以将数值转换为浮点数的方法有很多种,如: export ():将数值转换为浮点数。 else:将浮点数转换为整数。else函数没有返回值。 这些方法可以将数值转换为浮点数,也可以将浮点数转换为整数。如果我们想要将数字转换为浮点数,可以使用 export ()函数;如果想要将浮点数转换成整数,则可以使用 flag ()函数。 在 Python中有很多函数都可以用来转换数值,并且这些函数的使用方法也很简单。如果需要使用这些函数的话,可以先去学习一下相关的知识,然后再进行使用。

以下是一些常用的 pandas 库函数代码:

1. 读取 CSV 文件:

```python
import pandas as pd

df = pd.read_csv('file.csv')
```

2. 读取 Excel 文件:

```python
import pandas as pd

df = pd.read_excel('file.xlsx')
```

3. 查看数据框的前几行:

```python
df.head()
```

4. 查看数据框的后几行:

```python
df.tail()
```

5. 查看数据框的列名:

```python
df.columns
```

6. 查看数据框的行数和列数:

```python
df.shape
```

7. 查看数据框的数据类型:

```python
df.dtypes
```

8. 查看数据框的基本统计信息:

```python
df.describe()
```

9. 查看数据框的缺失值情况:

```python
df.isnull().sum()
```

10. 删除数据框中的某一列:

```python
df.drop('column_name', axis=1, inplace=True)
```

11. 选择数据框中的某一列:

```python
df['column_name']
```

12. 选择数据框中的多列:

```python
df[['column_name_1', 'column_name_2']]
```

13. 选择数据框中的某一行:

```python
df.loc[row_index]
```

14. 选择数据框中的多行:

```python
df.loc[start_index:end_index]
```

15. 选择数据框中的某一行和某一列:

```python
df.loc[row_index, 'column_name']
```

16. 选择数据框中的多行和多列:

```python
df.loc[start_index:end_index, ['column_name_1', 'column_name_2']]
```

17. 根据条件选择数据框中的行:

```python
df[df['column_name'] > 10]
```

18. 根据条件选择数据框中的行和列:

```python
df.loc[df['column_name'] > 10, ['column_name_1', 'column_name_2']]
```

19. 对数据框进行排序:

```python
df.sort_values('column_name', ascending=False)
```

20. 对数据框进行分组:

```python
df.groupby('column_name').mean()
```

21. 对数据框进行聚合:

```python
df.groupby('column_name').agg({'column_name_1': 'mean', 'column_name_2': 'sum'})
```

22. 对数据框进行合并:

```python
df_merged = pd.merge(df1, df2, on='column_name')
```

23. 对数据框进行连接:

```python
df_concat = pd.concat([df1, df2], axis=0)
```

猜你喜欢

转载自blog.csdn.net/qq_42751978/article/details/129763537