python dataframe基础入门

1.用数据生成DataFrame

# -*- coding: UTF-8 -*-
import pandas as pd
# 方法一
d1 = [{'col1':'a', 'co12':1}, {'col1':'b', 'co12':2}, {'col1':'c', 'co12':3}]
df = pd.DataFrame(d1)
print df
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
# 方法二
data = [['a', 1], ['b', 2], ['c', 3]]
df = pd.DataFrame(data, columns=['col1', 'col2'])
print df
  • 1
  • 2
  • 3
  • 4
# 方法三
df = pd.DataFrame({'col1': ['a', 'b', 'c'], 'col2': [1, 2, 3]})
print df
  • 1
  • 2
  • 3

输出结果:

   co12 col1
0     1    a
1     2    b
2     3    c
  • 1
  • 2
  • 3
  • 4

2.Dataframe常用方法:

# 查看列名
print df.columns
----------
Index([u'co12', u'col1'], dtype='object')
  • 1
  • 2
  • 3
  • 4
# 查看数据
print df.values
----------
[[1L 'a']
 [2L 'b']
 [3L 'c']]
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
# 查看数据类型
print df.dtypes
----------
co12     int64
col1    object
dtype: object
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
# 查看前n行
print df.head(2)
----------
   co12 col1
0     1    a
1     2    b
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
# 查看后n行
print df.tail(2)
----------
   co12 col1
1     2    b
2     3    c
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
# 排序
print df.sort_values(by='col1', ascending=False)
----------
   co12 col1
2     3    c
1     2    b
0     1    a
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
# 转置
print df.T
----------
      0  1  2
co12  1  2  3
col1  a  b  c
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
# 设置index
df = df.set_index('col1')
print df.index
----------
Index([u'a', u'b', u'c'], dtype='object', name=u'col1')

猜你喜欢

转载自blog.csdn.net/kwame211/article/details/80566602
今日推荐