通过字典映射,将DataFrame
某个文字列映射出一个数字列,使得在程序里使用更加方便。
import pandas as pd
data = pd.DataFrame({'name': ['h1', 'h1', 'h2', 'h2' ,'h3' ,'h4','h3' ,'h4']})
'''
name
0 h1
1 h1
2 h2
3 h2
4 h3
5 h4
6 h3
7 h4
'''
name_to_color = {
'h1': 0,
'h2': 1,
'h3': 2,
'h4': 3,
}
data['color'] = data['name'].map(name_to_color)
print(data)
'''
name color
0 h1 0
1 h1 0
2 h2 1
3 h2 1
4 h3 2
5 h4 3
6 h3 2
7 h4 3
'''