学习数据预处理

# GB18030,全称:国家标准GB18030 - 2005《信息技术中文编码字符集》,是中华人民共和国现时最新的内码字集,
# 是GB18030 - 2000《信息技术信息交换用汉字编码字符集基本集的扩充》的修订版。GB18030与GB2312 - 1980和GBK兼容,共收录汉字70244个
df = pd.read_csv(path, encoding="gb18030")

# 去掉集合竞价的时间
# 每个交易日9: 15至9: 25(深圳包括9: 15至9:25和14: 57至15: 00),证券交易所交易主机接受参与竞价交易的申报
# 每个交易日9: 25至9: 30,交易主机只接受申报,但不对买卖申报或撤销申报作处理。交易所认为必要时,可以调整接受申报时间

# loc 行
startTime = df.loc[0, '时间'][0:10]+' 09:26'
endTime = df.loc[0, '时间'][0:10]+' 15:00:01'

# 筛选
df = df[df['时间']>startTime]
df = df[df['时间']<endTime]

# T 转置
df = pd.DataFrame([in_volume, total_volume]).T
#  index : Write row names  写入行名
df.to_csv(path+r'/%s_资金流向.csv'%date, index=False, header=False, mode='a+')

猜你喜欢

转载自blog.csdn.net/qq_18310041/article/details/80089261