如何用pandas将某列进行唯一编码后,修改原dataframe

要用 Pandas 将某列进行唯一编码并修改原 DataFrame,可以使用 Pandas 中的 factorize() 函数和 DataFrame 的列操作方法。假设要将 DataFrame 中的 col 列进行唯一编码,代码如下:

python# 导入 Pandas 库
import pandas as pd

# 创建一个 DataFrame
df = pd.DataFrame({
    
    
    'col': ['A', 'B', 'C', 'A', 'C', 'B']
})

# 对 col 列进行唯一编码
df['col'], _ = pd.factorize(df['col'])

# 查看结果
print(df)

解释一下上面的代码:

  • pd.factorize(df['col']) 会返回 col 列进行唯一编码后的结果和编码映射表。因为我们只需要编码后的结果,所以用 _ 丢弃了编码映射表。
  • df['col'], _ = pd.factorize(df['col']) 将编码结果覆盖原 DataFrame 中的 col 列。
  • 最后,打印出来的 df 就是编码后的结果。

这样,就可以对原 DataFrame 进行修改了。

猜你喜欢

转载自blog.csdn.net/qq_38251616/article/details/129286855