复习小结3-数据结构

Series数据结构
    实际上是介绍一些Series的基本属性,和结构之间的关联并不大
    
    #制造Series  
    #可以直接用list传入数据,或者传入字典或标量  
    import pandas as P
    import numpy as N

    s1 = P.Series([1,2,3,4])
    s2 = P.Series({'A':1,'B':2,'C':3})
    s3 = P.Series(N.random.randn(10))
    #索引
    s[tag or location]
    #加入新数据,类似dataframe加入新列的操作(本质接近,都是加入一个低纬度的单位数据)
    #s3[10]=100

    #标签对齐
    我觉得这个翻译也不太好,这个更接近与一些标签的匹配特性
    实际意义就是如果两个Series相结合,index相同的会放在一起处理,不同的会分开并且与nan一起处理
#DataFrame数据结构
    #传入DataFrame,可以传入行列表,字典或者多维元祖
        #d1 = [1,2,3,4]
        d = [[1,2,3,4],[5,6,7]]
        d_1 = P.DataFrame(d,index = ['one','two'],columns = ['a','b','c','d'])

        d_2= {'A':[1,2,3],'B':[1,2,4],'C':[6,1,7]}#key为列标签元素的维度必须相同,否则报错
        d2 = P.DataFrame(d_2,index)

        d_3 = {('a','b'):{('A','B'):3,('A','C'):4},
       ('a','c'):{('A','B'):3,('A','D'):5}
    
        }
        d3 = P.DataFrame(d_3)#用多维元祖有点抽象,大概意思是字典内的key是分类,value的字典也是分类,传入后,pandas会自动对有分类的填充对应值,没有对应值的则填入nan

猜你喜欢

转载自blog.csdn.net/weixin_38644431/article/details/84973032