Linuxのテキスト処理ツールの論文

一般的に使用されるシンプルなツール

  猫[OPTION] ... [FILE] ... 

  •   -E:$表示行ターミネータ
  •   -n:それぞれの行を表示するためには番号が付けられています。
  •   -A:すべての制御文字を表示します
  •   -s:圧縮空気行為連続線
   より:ページングファイルを表示 
   -d:ページを表示するとヒントを終了 
  以下:出力ファイルまたはSTDINを表示するページの後のページ
  あなたが表示すると便利なコマンドが含まれます:
  /テキスト検索テキスト
  N / N次または前の一致にスキップ
  以下のコマンドは、ページャの男を使用するコマンドです
   テキストカットカット[OPTION] ... [FILE] ... 
  •   -f:最初のいくつかのフィールドを取ります
  •   -c:文字による切断
  •   -d:カットを指定し、デフォルトはタブです
  WCテキスト統計
  •   -l:行の数だけを数えます
  •   -w:世界は、言葉だけの合計数を計算します
  •   -c:合計バイト数だけ計算します
  •   -m:ちょうど文字の合計数を計算します
  •   -L:ファイル内の最も長い行の長さを示しています
   ソート、テキストを並べ替えます
  •   -r:出力を反転
  •   -R:ランダムな順序
  •   -n:サイズによってデジタル実行順序
  •   -f:文字のケースのオプション(倍)文字列を無視します
  •   -u:出力に重複行を削除
  •   C -tc区切りフィールドとして使用
  •   分割フィールドとしてCオプションを使用して-k X X列が複数回を編成するために使用することができます
   uniqの統計ツール
  •   -c:各行の数が繰り返し表示
  •   -d:ショーは行のみを複製します
  •   -u:重複する行を表示しません。
  •   多くの場合と組み合わせて使用​​し、ソートコマンド:ソートuserlist.txt | uniqの-c
   grepのテキストフィルタリング
   プリントと一致するように、ライン、テキスト検索ツール、ラインマッチングチェックによってターゲットテキスト行のためのユーザー指定の「モデル」に基づいて:の役割
  grepの[OPTIONS] PATTERN [FILE ...] 
  •   -m#:#回試合後に停止します
  •   -v:表示パターンは、ラインに一致しません
  •   -i:ケースを無視
  •   試合の統計情報への行数:-c
  •   -o:のみ一致する行を表示します
  •   -q:サイレントモードでは、出力情報をしません
  •   -A#:後后#hang
  •   -B#:前に、ライン#の前に
  •   -C#:コンテキスト、各長手方向列#
  •   -e:複数のオプションの現実や関係grepの間の「犬」ファイル-e「猫」-e 
  •   -w:単語全体にマッチ
  •   -E:使用ERE
  •   -F:fgrepは相当では、正規表現をサポートしていません。
  •   -f:ファイル処理モードに基づいてファイル
第二に、正規表現
   REGEXP:コントロール機能や、ワイルドカードながら、正規表現、モード文字とテキスト書かれた文字の特別な種類、一部の文字(メタ文字)は、文字リテラルの意味を表すものではありません
  プログラムサポートします。grep、sedは、awkは、vimの、より少ない、nginxの、ニスなど 
  基本的な正規表現:BRE、拡張正規表現:ERE 2つのカテゴリに分けます 
  基本的な正規表現のメタ文字 
  •   。任意の1文字に一致します
  •   [リチウム] [王] [0-9]:[]特定の範囲内で、列の式を任意の単一文字に一致
  •   任意の単一の文字[^]指定範囲外の一致しました 
  •  [:Alnum:]の文字と文字
  •   [:アルファ:] AZ、AZ、任意の英語の大文字と小文字の略
  •   【:下:]小文字[:アッパー:]大文字
  •   [ブランク:]空白文字、スペース、タブなど
  •   【:スペース:】垂直及び水平空白(比[ブランク:】広い範囲を含む)の 
  •   [:CNTRL:]制御不能な印刷された文字(バックスペース、削除、ベル...
  •   [:桁:] 10進数:XDIGIT:] 16進数 
  •   [:グラフ:非空白文字が印字可能
  •   [:印刷:]印字可能な文字
  •   [:PUNCT:]句読点
  •   *ゼロ貪欲モードを含む、文字の前に何度でもマッチ:できるだけ長く一致として
  •   *任意の長さの任意の文字
  •   \?その前の文字0または1回の一致
  •   \ +少なくとも一度はその前の文字にマッチします
  •   \ {N \}は直前の文字をn回一致します
  •   \ {M、N \}は、上記文字は、最大で、少なくともm回一致し、n回
  •   \ {N \}上記文字一致までn回
  •   \ {N、\}上記文字一致少なくともn回

場所は固定:ポジショニングが表示されるように 

  •   ^左のほとんどの行に固定モードの始まりを
  •    $右端のパターンのために、行の終わりを停泊   
  •   ^パターンは、全体のラインのためのパターンマッチングを$  
  •   ^$ 空行  
  •    ^ [[:スペース:]] * $空行  
  •    \ <または左のワードパターンのための\ bは単語の初期アンカー  
  •    \>または終了\ bのアンカー、単語の正しいモード   
  •   \ <パターン\>は単語全体にマッチします
グループ化と参照
  パケット:などのプロセス全体として、一緒に結ば一つ以上の文字の\(\):\(ルート\)\ +
  パケットは内部変数の正規表現エンジンに記録するパターンマッチングコンテンツ括弧、これらの変数の名前は次のとおりです。\ 1、\ 2 \ 3、...
  \ 1一致した文字と一致する左ブラケットと右ブラケットの間に左第一のモードから示します
  例:\(文字列1 \(string2の\)\)
  \ 1:文字列1の\(string2の\)
  \ 2:string2の
  逆方向参照:文字参照の上記括弧パケットモードではなく、パターン自体にマッチしました
  または:\ |
  例:\ | BAまたはb
  C \ |猫のCや猫
  \(Cの\ | Cの\)猫或猫で

おすすめ

転載: www.cnblogs.com/kading/p/10923025.html