新时代下载安装最新版,rm资金盘

grep是Linux中用于文本處理的最有用和功能最強(qiáng)大的命令之一。 grep在一個(gè)或多個(gè)輸入文件中搜索與正則表達(dá)式匹配的行，并將每條匹配的行寫(xiě)入標(biāo)準(zhǔn)輸出。

在本文中，我們將探討在grep的GNU版本中如何使用正則表達(dá)式的基礎(chǔ)，大多數(shù)Linux操作系統(tǒng)默認(rèn)情況下都提供此功能。

Grep正則表達(dá)式

正則表達(dá)式或正則表達(dá)式是與一組字符串匹配的模式。模式由運(yùn)算符，構(gòu)造文字字符和元字符組成，它們具有特殊的含義。 GNU grep支持三種正則表達(dá)式語(yǔ)法，Basic，Extended和Perl兼容。

最簡(jiǎn)單的形式是，當(dāng)沒(méi)有給出正則表達(dá)式類型時(shí)，grep會(huì)將搜索模式解釋為基本正則表達(dá)式。要將模式解釋為擴(kuò)展的正則表達(dá)式，請(qǐng)使用-E（或--extended-regexp）選項(xiàng)。

在GNU的grep實(shí)現(xiàn)中，基本正則表達(dá)式和擴(kuò)展正則表達(dá)式語(yǔ)法之間沒(méi)有功能上的區(qū)別。唯一的區(qū)別是，在基本正則表達(dá)式中，元字符？，+，{，|，（和）被解釋為文字字符。為了在使用基本正則表達(dá)式時(shí)保持元字符的特殊含義，必須使用反斜杠（）對(duì)字符進(jìn)行轉(zhuǎn)義。稍后我們將解釋這些和其他元字符的含義。

通常，您應(yīng)始終將正則表達(dá)式括在單引號(hào)中，以避免shell解釋和擴(kuò)展元字符。

文字匹配

grep命令最基本的用法是在文件中搜索文字字符或一系列字符。例如，要在/ etc / passwd文件中顯示所有包含字符串“ bash”的行，您可以運(yùn)行以下命令：

［linuxidc@localhost www.linuxidc.com］$ grep bash /etc/passwd

輸出應(yīng)如下所示：

root:x：0:0：root:/root:/bin/bash

linuxidc:x：1000:1000:linuxidc:/home/linuxidc:/bin/bash

在此示例中，字符串“ bash”是由四個(gè)文字字符組成的基本正則表達(dá)式。這告訴grep搜索帶有緊隨其后的“ a”，“ s”和“ h”的字符串“ b”。

缺省情況下，grep命令區(qū)分大小寫(xiě)。這意味著將大寫(xiě)和小寫(xiě)字符視為不同的字符。要在搜索時(shí)忽略大小寫(xiě)，請(qǐng)使用-i選項(xiàng)（或--ignore-case）。

請(qǐng)務(wù)必注意，grep會(huì)將搜索模式作為字符串而不是單詞來(lái)查找。因此，如果您要搜索“ gnu”，則grep還將打印“ gnu”嵌入較大字詞（例如“ cygnus”或“ magnum”）的行。

如果搜索字符串包含空格，則需要將其用單引號(hào)或雙引號(hào)引起來(lái)：

$grep “Gnome Display Manager” /etc/passwd

錨定Anchoring

Anchoring是元字符，可讓您指定必須在該行中找到匹配項(xiàng)的位置。

^（脫字符號(hào)）符號(hào)與一行開(kāi)頭的空字符串匹配。在以下示例中，僅當(dāng)字符串“ linux”出現(xiàn)在行的開(kāi)頭時(shí)才匹配。

$grep ‘^linux’ file.txt

$（美元）符號(hào)與行首的空字符串匹配。要查找以字符串“ linux”結(jié)尾的行，可以使用：

$grep ‘linux$’ file.txt

您還可以使用兩個(gè)錨點(diǎn)構(gòu)造一個(gè)正則表達(dá)式。例如，要查找僅包含“ linux”的行，請(qǐng)運(yùn)行：

$grep ‘^linux$’ file.txt

另一個(gè)有用的示例是匹配所有空行的^ $模式。

匹配單個(gè)字符

。（點(diǎn)）符號(hào)是與任何單個(gè)字符匹配的元字符。例如，要匹配以“ kan”開(kāi)頭，然后有兩個(gè)字符并以字符串“ roo”結(jié)尾的任何內(nèi)容，則可以使用以下模式：

$grep ‘kan..roo’ file.txt

括號(hào)表達(dá)式

方括號(hào)表達(dá)式允許將一組字符括在方括號(hào)［］中來(lái)匹配一組字符。例如，找到包含“ accept”或“ accent”的行，可以使用以下表達(dá)式：

$grep ‘a(chǎn)cce［np］t’ file.txt

如果方括號(hào)內(nèi)的第一個(gè)字符是插入符號(hào)^，則它匹配方括號(hào)中未包含的任何單個(gè)字符。以下模式將匹配以“ co”開(kāi)頭的字符串的任意組合，后接除“ l”之后為“ la”的任何字母（例如“ coca”，“ cobalt”等），但不匹配包含“ cola”的行 ”：

$grep ‘co［^l］a’ file.txt

您可以在方括號(hào)內(nèi)指定一系列字符，而不是一個(gè)一個(gè)地放置字符。通過(guò)指定以連字符分隔的范圍的第一個(gè)和最后一個(gè)字符來(lái)構(gòu)造范圍表達(dá)式。例如，［a-a］等效于［abcde］，［1-3］等效于［123］。

以下表達(dá)式匹配以大寫(xiě)字母開(kāi)頭的每一行：

$grep ‘^［A-Z］’ file.txt

grep還支持括號(hào)中預(yù)定義的字符類。下表顯示了一些最常見(jiàn)的字符類：

QuantifierCharacter Classes

［：alnum：］字母數(shù)字字符。

［：alpha：］字母字符。

［：blank：］空格和制表符。

［：digit：］數(shù)字。

［：lower：］小寫(xiě)字母。

［：upper：］大寫(xiě)字母。

有關(guān)所有字符類別的完整列表，請(qǐng)參閱Grep手冊(cè)。

量詞

量詞Quantifier允許您指定要出現(xiàn)的匹配項(xiàng)必須出現(xiàn)的項(xiàng)數(shù)。下表顯示了GNU grep支持的量詞：

Quantifier描述

*匹配上一項(xiàng)零次或多次。

？匹配上一項(xiàng)零或一次。

+將上一項(xiàng)匹配一次或多次。

{n}將前一項(xiàng)精確匹配n次。

{n，}至少匹配n個(gè)項(xiàng)目。

{，m}最多匹配m次以上項(xiàng)。

{n，m}將前一項(xiàng)匹配n至m次。

*（星號(hào)）字符與前面的項(xiàng)目匹配零次或多次。以下將匹配“right”，“sright”，“ssright”等等。

$grep ‘s*right’

下面是更高級(jí)的模式，它匹配所有以大寫(xiě)字母開(kāi)頭，以句點(diǎn)或逗號(hào)結(jié)尾的行。 .* 正則表達(dá)式匹配任意數(shù)量的任何字符：

$grep -E ‘^［A-Z］.*［。，］$’ file.txt

？（問(wèn)號(hào)）字符使前一項(xiàng)為可選，并且只能匹配一次。以下將同時(shí)匹配“bright”和“right”。？字符以反斜杠轉(zhuǎn)義，因?yàn)槲覀兪褂玫氖腔菊齽t表達(dá)式：

$grep ‘b？right’ file.txt

下面是使用擴(kuò)展正則表達(dá)式的同一個(gè)正則表達(dá)式：

$grep -E ‘b？right’ file.txt

+（加號(hào)）字符與前面的項(xiàng)目匹配一次或多次。以下將匹配“sright”和“ssright”，但不匹配“right”：

$grep -E ‘s+right’ file.txt

大括號(hào)字符{}使您可以指定確切的數(shù)字，上限或下限或發(fā)生匹配必須發(fā)生的范圍。

以下內(nèi)容匹配3到9位之間的所有整數(shù)：

$grep -E ‘［［：digit：］］{3，9}’ file.txt

交替Alternation

交替是一個(gè)簡(jiǎn)單的“或”。替換操作符| （pipe）允許您指定不同的可能匹配，可以是文字字符串或表達(dá)式集。該操作符在所有正則表達(dá)式操作符中優(yōu)先級(jí)最低。

在下面的例子中，我們搜索Nginx日志錯(cuò)誤文件中出現(xiàn)的所有單詞fatal， error和critical：

$grep ‘fatal|error|critical’ /var/log/nginx/error.log

如果使用擴(kuò)展正則表達(dá)式，則不應(yīng)轉(zhuǎn)義運(yùn)算符|，如下所示：

$grep -E ‘fatal|error|critical’ /var/log/nginx/error.log

分組

分組是正則表達(dá)式的一項(xiàng)功能，可讓您將模式分組在一起并將其作為一項(xiàng)引用。使用括號(hào)（）創(chuàng)建組。

使用基本正則表達(dá)式時(shí)，必須用反斜杠（）對(duì)括號(hào)進(jìn)行轉(zhuǎn)義。

下面的示例同時(shí)匹配“ fearless”和“ less”。？量詞使（fear）組成為可選的：

$grep -E ‘（fear）？less’ file.txt

反斜杠特殊表達(dá)式

GNU grep包含幾個(gè)元字符，由反斜杠和常規(guī)字符組成。下表顯示了一些最常見(jiàn)的特殊反斜杠表達(dá)式：

ExpressionDescription

單詞鎖定符

《在單詞開(kāi)頭匹配一個(gè)空字符串。

》在單詞末尾匹配一個(gè)空字符串。

w匹配一個(gè)單詞。

s匹配一個(gè)空格。

以下模式將匹配單獨(dú)的單詞“ abject”和“ object”。如果嵌入較大的單詞，則不會(huì)匹配這些單詞：

$grep ‘［ao］bject’ file.txt

總結(jié)

正則表達(dá)式用于文本編輯器，編程語(yǔ)言和命令行工具，例如grep，sed和awk。在搜索文本文件，編寫(xiě)腳本或過(guò)濾命令輸出時(shí)，了解如何構(gòu)造正則表達(dá)式將非常有幫助。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴