如何用pandas将某列one-hot编码后,修改原dataframe

要用Pandas将某列进行 one-hot 编码并修改原 DataFrame,可以使用 Pandas 中的 get_dummies() 函数和 DataFrame 的列操作方法。假设要将 DataFrame 中的 col 列进行 one-hot 编码,代码如下:

python# 导入 Pandas 库
import pandas as pd

# 创建一个 DataFrame
df = pd.DataFrame({
    
    
    'col': ['A', 'B', 'C', 'A', 'C', 'B']
})

# 对 col 列进行 one-hot 编码
one_hot = pd.get_dummies(df['col'])

# 将 one-hot 编码后的结果与原 DataFrame 进行合并
df = pd.concat([df, one_hot], axis=1)

# 删除原始的 col 列
df = df.drop('col', axis=1)

解释一下上面的代码:

  • pd.get_dummies(df['col']) 会返回 col 列进行 one-hot 编码后的结果。
  • pd.concat([df, one_hot], axis=1) 会将 one_hot 和原 DataFrame 按列方向进行合并。
  • df.drop('col', axis=1) 会删除原始的 col 列。

这样,就可以对原 DataFrame 进行修改了。

猜你喜欢

转载自blog.csdn.net/qq_38251616/article/details/129286796
今日推荐