文章目录
1 基本知识
将磁盘上的数据文件读入Python数据结构,大多是使用pandas.read_csv
之类的高级工具。
为了打开一个文件以便读写,可以使用内置的open函数,以及一个相对或者绝对的文件路径。
In [207]: path = 'examples/segismundo.txt'
In [208]: f = open(path)
默认情况下,文件是以只读模式(’r’)
打开的。然后,我们就可以像处理列表那样来处理这个文件句柄f了,比如对行进行迭代:
for line in f:
pass
由于从文件中取出的行都有行结束符(EOL),因此去掉EOL的方法如下:
In [209]: lines = [x.rstrip() for x in open(path)]
In [210]: lines
Out[210]:
['Sueña el rico en su riqueza,',
'que más cuidados le ofrece;',
'',
'sueña el pobre que padece',
'su miseria y su pobreza;',
'',
'sueña el que a medrar empieza,',
'sueña el que afana y pretende,',
'sueña el que agravia y ofende,',
'',
'y en el mundo, en conclusión,',
'todos sueñan lo que son,',
'aunque ninguno lo entiende.',
'']