Datawhale学习笔记Day01

1. 课程的网址链接

课程地址:https://github.com/datawhalechina/hands-on-data-analysis https://gitee.com/datawhalechina/hands-on-data-analysis

B站视频:https://www.bilibili.com/video/BV1Uv411p77r

2. 关于numpy与pandas的介绍文档

NumPy 参考手册 | NumPy 中文

User Guide — pandas 1.4.2 documentation

3. Pandas基础  

1)逐块读取数据

df=pd.read.csv("data.csv",chunksize=1000)
df.get_chunk()

2)查看数据

df.describe() #查看数据的形式
df.tail() #查看末尾的几行
4. 相对路径载入报错时,尝试使用os.getcwd()查看当前工作目录

5. 关于Dataframe与Series的区别

Series是一种类似于一维数组的对象。它由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)组成。

df=Series()

DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共同用一个索引)。

df=DataFrame()

猜你喜欢

转载自blog.csdn.net/weixin_44897685/article/details/124809477