리눅스 명령 UNIQ 중복 항목을 제거

명령 UNIQ이 도입, UNIQ 가족에 리눅스 명령 파이프 라인, 그 주요 기능은 중복을 제거하는 것입니다.

UNIQ 명령을 소개하기 전에 다음과 같이 읽고, 다음과 같은 경우가 /tmp/uniq.txt 사용해야에서의 새 파일을 만들 수 있습니다

 

기본적으로 UNIQ는 너무 무거운 데이터를 복제 인접 검색 할 수 있습니다. /tmp/uniq.txt에서 "onmpw 웹 사이트는"세 가지를 가지고 있지만 다른 두 가지 중 하나가 그래서 그냥 무거운, 공감 "오류 PHP 함수"로 이동, 인접하지 않은 있지만 또한 경우입니다.

상기 검색 메카니즘의 관점에서, 정상적인 상황 UNIQ하고 있도록 정렬 명령을 함께 사용했다.

# 종류의 1.TXT | UNIQ 
알파 CSS는 웹 고양이 리눅스 명령 오류 PHP 함수 안녕하세요 세계 웹 사이트 onmpw recruise 페이지 사이트 반복 데이터 wello 웹 사이트 없다

이제 모든 중복 중복 제거 프로세스를 통해 없었을되어보세요.

음, 작은 시험 헬기 이후의이 간단한 소개의 옵션 UNIQ 명령에서 시작하자.

-c  통계 데이터의 각 행의 반복 횟수

종류 1.TXT | UNIQ - C 
1 알파 CSS는 웹 1 고양이 리눅스 명령 오류 PHP 함수 (1) 안녕 세계 3 onmpw 웹 사이트 1 recruise 페이지 사이트 1 반복 데이터가없는 1 wello 웹 사이트

우리는 "웹 사이트 onmpw"의 "오류 PHP 함수는"두 번 표시 참조 세 번 나타납니다. 나머지는 1로 복제되지 않습니다.

-i은  케이스를 무시

1.TXT "오류 PHP 함수"데이터의 행을 추가

고양이 1 개 .txt 인 

알파 CSS는 웹 
고양이 리눅스 명령 
오류 PHP 함수 
안녕하세요 세계 
웹 사이트 onmpw 
웹 사이트 onmpw 
wello 웹 사이트 
오류 PHP 함수 
recruise 페이지 사이트 
오류 PHP 함수 
를 반복 데이터가없는 
웹 사이트 onmpw
종류 1.TXT | UNIQ -c 

1 알파 CSS는 웹
 1 고양이 리눅스 명령
 오류 PHP 함수
 1 오류 PHP 함수
 (1) 안녕 세계
 3 개 onmpw 웹 사이트
 1 recruise 페이지 사이트
 1 반복 데이터가없는
 1 개 wello 웹 사이트

우리는 결과를, UNIQ 기본은 대소 문자를 구분 본다. -i는 대문자 문제를 무시할 수 사용

 

종류의 1 이 .txt | UNIQ -c -i 
1 알파 CSS는 웹 1 고양이 리눅스 명령 3 오류 PHP 함수 (1) 안녕 세계 3 onmpw 웹 사이트 1 recruise 페이지 사이트 1 반복 데이터가없는 1 wello 웹 사이트

지금의 경우는 무시되어 있지 않습니다 봐.

-u  중복없이 출력 데이터 만

종류의 1 이 .txt | UNIQ -iu 

알파 CSS는 웹 
고양이 리눅스 명령 
안녕하세요 세계 
recruise 페이지 사이트 
반복 데이터가없는 
wello 웹 사이트

즉 없습니다 "오류 PHP 함수"와 "onmpw 웹 사이트"의 결과가되지 않았습니다 출력을했다.

-w N은  다시 문장을하는 N 문자의 첫 번째 문자를 검색 시작을 나타냅니다.

종류의 1 이 .txt | UNIQ는 -iw 2 

알파 CSS는 웹
 고양이 리눅스 명령
 오류 PHP 함수
 안녕하세요 세계
 웹 사이트 onmpw
 recruise 페이지 사이트
 wello 웹 사이트

여기서 우리는 두 개의 문자가 다시, 그래서이 두 라인은 또한 반복 된 것으로 간주 반복 전 모집, UNIQ 첫 번째 두 개의 문자를 검색 할 수 있습니다.

-f N은  제 N 필드는 제 N + 1 개 필드의 데이터의 취득을 개시 반복 이동 나타낸다. 탭 또는 구분 기호로 공백 문자.

 

종류 1.TXT | UNIQ -icf 2 

알파 CSS는 웹
 1 고양이 리눅스 명령
 3 오류 PHP 함수
 (1) 안녕 세계
 4 onmpw 웹 사이트
 (1) 반복 데이터가없는
 1 개 wello 웹 사이트

우리는 무거운 형을 선고 세 번째 필드의 시작 부분에서 앞의 두 분야에 걸쳐 약간 인 결과를 볼 수 있습니다. 같은 "recruise 페이지 사이트"와 세 번째 필드에서 "onmpw 웹 사이트는"동일한 데이터로 간주됩니다. 우리는 "wello 웹 사이트"와 "onmpw 웹 사이트"를 참조하지만 세 번째 필드와 같은뿐만 아니라, 두 번째는 동일합니다. 그것은 그것의 "onmpw 웹 사이트"중복 데이터에 포함되지 않습니다 왜. 이 문제는 그 앞 뒷면으로 들어 UNIQ에만 인접한 데이터를 검출하는 중복.

 

이 문제는 정렬 순서에 진행하는 데 필요한 해결합니다. 그것의 명령을 정렬하는 -k 옵션을 기억, 그래, 우리가 해결하는 데 사용합니다.

종류 -k 2   이 .txt | UNIQ -icf 2 

알파 CSS는 웹 1 고양이 리눅스 명령 반복 데이터가없는 1 recruise 페이지 사이트 3 오류 PHP 함수 4 onmpw 웹 사이트 1 안녕하세요 세계

우리는 해결되지 참조하십시오.

-s N은 첫 번째 N 문자를 건너 표현이 옵션은 우리가 여기에 인용 예에없는, 그리고 N 사용 거의에게 -f이 옵션을 선택합니다. 그냥 N은 N 필드 인 -f의 전면을 건너, -s 첫 번째 N 문자를 생략하는 것입니다.

-d  제 스트라이프의 데이터가 중복된다.

종류의 1 이 .txt | UNIQ는 -idw 

반복 데이터의 
오류 PHP 함수없는 
웹 사이트 onmpw

이 세 가지의 결과. 왜이 데이터, 응용 프로그램의 관심 -w 2의 "데이터를 반복하지 않습니다."

-D  모든 출력의 중복

종류의 1 이 .txt | UNIQ -iDw 

반복없이 데이터 
recruise 페이지 사이트 
오류 PHP 함수 
오류 PHP 함수 
오류 PHP 함수 
웹 사이트 onmpw 
웹 사이트 onmpw 
웹 사이트 onmpw

음, 이미 완성에 명령 UNIQ 모든 일반적인 옵션이 도입된다. 명령 정보 UNIQ을 사용할 수 있습니다 더 자세한 정보를 UNIQ 소개.

나는이 문서가 도움이 될 수 있도록 노력하겠습니다.

추천

출처www.cnblogs.com/lee-qi/p/11440518.html