已解决(pandas赋值错误)SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead
See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
报错代码
粉丝群一个小伙伴在使用pandas对DataFrame中的某一列进行修改赋值时给出如下警告(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴),报错代码如下:
import pandas as pd
import sqlalchemy
df = pd.read_excel("./test.xls")
temp = df[['name', 'age']]
temp['address'] = '四川'
print(temp)
# df.to_sql("ORG_HONOR", con=engine, if_exists="append", index=False, chunksize=2000)
报错信息截图:
报错翻译
报错信息翻译:
设置有复制警告:
试图在数据帧的切片副本上设置值。
尝试改用.loc[row_indexer,col_index]=值
请参阅文档中的注意事项:https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a视图与a副本
报错原因
首先要理解的是,SettingWithCopyWarning
是一个警告,而不是错误 Error。
错误表明某些内容是“坏掉”的,例如无效语法(invalid syntax)或尝试引用未定义的变量。警告的作用是提醒程序员,他们的代码可能存在潜在的错误或问题,但是这些操作仍然是该编程语言中的合法操作。在这种情况下,警告很可能表明一个严重但不容易意识到的错误。SettingWithCopyWarning 告诉你,你的操作可能没有按预期运行,你应该检查结果以确保没有出错。
这是在警告你类似这种的赋值,请使用.loc方法,理解这个之前还是想介绍一下pandas的视图模式和副本模式:
视图模式
将一个对象整体赋值给另一个变量
修改一个变量,另一个变量值也会变
多个变量数据指向同一内存数据
副本模式
将一个对象查询的一部分值赋值给另一个变量
修改一个变量,另一个变量值不会变
当将一个对象整体赋值给另一个变量时,视图模式,两个变量对应的内存地址相同,修改一个变量,另一个变量也会改变。
当使用copy()将一个对象赋值给另一个变量时
或者使用查询赋值,查询数据的一部分并赋值给其他变量
当赋值为原数据查询的一部分时,是副本模式,修改一个变量不会影响另一个变量
解决方法
使用.loc[row_indexer,col_indexer] = value instead
进行赋值:

temp.loc[:,'address'] = '四川'