중복 행을 제거하기위한 [파이썬] 파이썬 파이썬 2020년 2월 11일를 CSV

팬더와 .Drop_duplicates 함수 라이브러리

다음과 같이 코드입니다 :

1  임포트 또 shutil
 2  임포트 PD 등 팬더
 3  
4  
5 프레임 pd.read_csv = ( ' E : /bdbk.csv ' 엔진 = ' 파이썬 ' )
 6 개 데이터 = frame.drop_duplicates (서브셋 = ' 名称' ] 보관 = ' ' , 인플레 이스 = FALSE)
 7 data.to_csv ( " E : /baike.csv ' = 코딩 ' UTF8을 ' )

세 개의 매개 변수의 .drop_duplicates이 있습니다

DataFrame.drop_duplicates (집합 = 없음, 킵 = ' 최초 ' , 인플레 이스 = 거짓)

서브셋 = 'A', 'B'] 컬럼 A 및 B 중복 데이터

다음 매개 변수는 다음과 같습니다

집합 : 열 레이블 또는 레이블의 순서 , 선택
특정 열을 지정, 모든 열 기본
유지 : {, '첫번째' ' 마지막', 거짓} 기본 '첫 번째'
제거 중복 및 항목이 먼저 표시 유지
올바른 위치를 : 부울, 거짓 기본값
수정하거나 직접 원본 데이터의 복사본을 유지하기 위해

추천

출처www.cnblogs.com/zlc364624/p/12293666.html