引言Microsoft?.NETFramework對正則表達(dá)式的支持是一流的,甚至在Microsoft?ASP.NET中也有依賴正則表" />

亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

ASP.NET 中的正則表達(dá)式

系統(tǒng) 2013 0
<iframe align="center" marginwidth="0" marginheight="0" src="http://www.zealware.com/csdnblog336280.html" frameborder="0" width="336" scrolling="no" height="280"></iframe>

引言

Microsoft?.NET Framework 對正則表達(dá)式的支持是一流的,甚至在 Microsoft? ASP.NET 中也有依賴正則表達(dá)式語言的控件。本文介紹了深入學(xué)習(xí)正則表達(dá)式的基礎(chǔ)知識和推薦內(nèi)容。

本文主要面向?qū)φ齽t表達(dá)式知之甚少或沒有使用經(jīng)驗,但卻熟悉 ASP.NET、可借助 .NET 編程的初學(xué)者。此外,希望本文連同 regular expression cheat sheet 成為有正則表達(dá)式使用經(jīng)驗的開發(fā)者的手頭參考資料或進(jìn)修資料。本文討論內(nèi)容如下:

1.

正則表達(dá)式使用歷史簡介

2.

簡單表達(dá)式

3.

限定符

4.

元字符

5.

字符類

6.

預(yù)定義的集合元字符

7.

表達(dá)式示例詳細(xì)內(nèi)容

8.

ASP.NET 中的驗證

9.

正則表達(dá)式 API

10.

免費工具

11.

高級主題概述

12.

小結(jié)和其他資源

通常,如果對本文或?qū)φ齽t表達(dá)式有疑問,請訪問 http://www.aspadvice.com/ ,通過 regex mailing list 提出問題。編寫此文時其中已有 350 多個訂戶參與。

正則表達(dá)式使用歷史簡介

正則表達(dá)式設(shè)計于五十年代,存在至今。正則表達(dá)式最初用于描述“正則集”,它們是一些神經(jīng)生理學(xué)家研究的模式。正則表達(dá)式最早由數(shù)學(xué)家 Stephen Kleene 提出,最終由 Ken Thompson 在兩種非常流行的文本實用程序 qed 和 grep 中使用。Jeffrey Friedl 在其著作“Mastering Regular Expressions (2 nd edition)”中對此作了進(jìn)一步闡述。建議那些希望更多了解正則表達(dá)式理論和歷史的人看看這本書。

在最近的五十年中,正則表達(dá)式逐漸從模糊深奧的數(shù)學(xué)概念發(fā)展為在各類工具和軟件包中應(yīng)用的主要功能。盡管數(shù)十年來很多 UNIX 工具都支持正則表達(dá)式,但僅僅是近十年來,它才在大部分 Windows 開發(fā)者工具包中得到體現(xiàn)。在 Microsoft? Visual Basic? 6 或 Microsoft? VBScript 中,即使情況理想,正則表達(dá)式仍難以使用。但隨著.NET Framework 的推行,正則表達(dá)式的支持發(fā)展到極點,所有 Microsoft 開發(fā)者和所有 .NET 語言都可以使用正則表達(dá)式。

那么,正則表達(dá)式究竟是什么呢?正則表達(dá)式是一種語言,它可以明確描述文本字符串中的模式。除了簡單描述這些模式之外,正則表達(dá)式引擎通常可用于遍歷匹配,并使用模式作為分隔符來將字符串解析為子字符串,或以智能方式替換文本或重新設(shè)置文本格式。正則表達(dá)式為解決與文本處理有關(guān)的許多常見任務(wù)提供了有效而簡捷的方式。

在討論正則表達(dá)式時,通常以正則表達(dá)式匹配(或不匹配)的文本為基礎(chǔ)分析正則表達(dá)式。本文(以及 System.Text.RegularExpressions 類)將在正則表達(dá)式交互操作中引用 3 個參與對象:正則表達(dá)式的“模式”、“輸入”字符串和字符串內(nèi)的所有模式的“匹配”。

簡單表達(dá)式

最簡單的正則表達(dá)式大家都已熟悉,即文字字符串。特定的字符串可通過文字本身加以描述;像 foo 這樣的正則表達(dá)式模式可精確匹配輸入的字符串 foo 。在本例中,也將匹配如下輸入: The foo d was quite tasty ,如果希望精確匹配,這可能不是預(yù)期結(jié)果。

當(dāng)然,使用正則表達(dá)式匹配等于它自身的精確字符串是沒有價值的實現(xiàn),不能體現(xiàn)正則表達(dá)式的真正作用。假如不查找 foo ,而是查找以字母 f 開頭的所有單詞,或所有 3 個字母的單詞,那該怎么辦?目前,這超出了文字字符串的合理范圍。我們需要更加深入地研究正則表達(dá)式。下面是一個文字表達(dá)式示例及一些匹配的輸入。

模式 輸入(匹配)

foo

foo foo d、 foo t、“There's evil a foo t.”

限定符

限定符提供了一種簡單方法,用于指定在模式中允許特定字符或字符集自身重復(fù)出現(xiàn)的次數(shù)。有 3 個非顯式限定符:

1.

* ,描述“出現(xiàn) 0 或多次”。

2.

+,描述“出現(xiàn) 1 或多次”。

3.

? ,描述“出現(xiàn) 0 或 1 次”。

限定符始終引用限定符前(左邊)的模式,通常是單個字符,除非使用括號創(chuàng)建模式組。下面是一些模式示例及匹配的輸入。

模式 輸入(匹配)

fo*

foo fo e、 foo d、 fooo t、“ fo rget it”、 f unny、 pu ff y

fo+

foo fo e、 foo d、 foo t、“ fo rget it”

fo?

fo o、 fo e、 fo od、 fo ot、“ fo rget it”、 f unny、pu ff y

除了指定給定模式準(zhǔn)確出現(xiàn) 0 或 1 次之外, ? 字符還可強制模式或子模式匹配數(shù)目最少的字符(如果匹配輸入字符串中的多個字符)。

除了非顯式限定符(一般叫做限定符,但為區(qū)別于下一組,故稱非顯式限定符)之外,還有顯式限定符。在模式出現(xiàn)次數(shù)方面,限定符的概念非常模糊。使用顯式限定符則可準(zhǔn)確指定數(shù)字、范圍或數(shù)字集。顯式限定符位于所應(yīng)用的模式的后邊,這一點與正則限定符一樣。顯式限定符使用花括號 {} 及其中的數(shù)字值表示模式出現(xiàn)次數(shù)的上下限。例如, x{5} 將準(zhǔn)確匹配 5 個 x 字符 ( xxxxx )。如果僅指定一個數(shù)字,則表示次數(shù)上限;如果數(shù)字后跟一個逗號,如 x{5,} ,表示匹配任何出現(xiàn)次數(shù)大于 4 的 x 字符。下面是一些模式示例及匹配的輸入。

模式 輸入(匹配)

ab{2}c

abbc 、aa abbc cc

ab{,2}c

ac abc abbc 、a abbc c

ab{2,3}c

abbc abbbc 、a abbc c、a abbbc c

元字符

在正則表達(dá)式中,有一種意義特殊的構(gòu)造,即元字符。目前已知的元字符有很多,如 * ? + {} 字符。其他字符在正則表達(dá)式語言中都有特殊的含義。這些字符包括: $ ^ . [ ( | ) ] /

. (句點或點)元字符是最簡單但最常用的一個字符。它可匹配任何單字符。如果要指定某些模式可包含任意組合的字符,使用句點非常有用,但一定要在特定長度范圍內(nèi)。此外,我們知道表達(dá)式將對包含在較長字符串中的所有模式進(jìn)行匹配,假如只需要精確匹配模式,又該怎么辦?這在驗證方案中經(jīng)常出現(xiàn),例如,要確保用戶輸入的郵政編碼或電話號碼的格式正確。使用 ^ 元字符可指定字符串(或行)的開始,使用 $ 元字符可指定字符串(或行)的結(jié)束。通過將這些字符添加到模式的開始和結(jié)束處,可強制模式僅匹配精確匹配的輸入字符串。如果 ^ 元字符用在方括號 [ ] 指定的字符類的開頭,也有特殊的含義。具體內(nèi)容見下。

/ (反斜杠)元字符既可根據(jù)特殊含義“轉(zhuǎn)義”字符,也可指定預(yù)定義集合元字符的實例。同樣,具體內(nèi)容見下。為了在正則表達(dá)式中包括文字樣式的元字符,必須使用反斜杠進(jìn)行“轉(zhuǎn)義”。例如,如果要匹配以“c:/”開始的字符串,可使用: ^c:// 。注意,要使用 ^ 元字符指出字符串必須以此模式作為開始,然后用反斜杠元字符轉(zhuǎn)義文字反斜杠。

| (管道)元字符用于交替指定,特別用于在模式中指定“此或彼”。例如, a|b 將匹配包含“a”或“b”的任何輸入內(nèi)容,這與字符類 [ab] 非常類似。

最后,括號 ( ) 用于給模式分組。它允許使用限定符讓一個完整模式出現(xiàn)多次。為了便于閱讀,或分開匹配特定的輸入部分,可能允許分析或重新設(shè)置格式。

下面列出元字符的一些使用示例。

模式 輸入(匹配)

.

a b c 1 2 3

.*

Abc , 123 , 任意字符串 , 無字符時也匹配

^c://

c:/windows c:///// c:/foo.txt c:/ 后跟任何其他內(nèi)容

abc$

abc 123abc abc 結(jié)束的任意字符串

(abc){2,3}

abcabc abcabcabc

字符類

字符類是正則表達(dá)式中的“迷你”語言,在方括號 [ ] 中定義。最簡單的字符類只不過是括號中的一個字符表,如 [aeiou] 。在表達(dá)式中使用字符類時,可在模式的此位置使用其中任何一個字符(但只能使用一個字符,除非使用了限定符)。請注意,不能使用字符類定義單詞或模式,只能定義單個字符。

要指定任何數(shù)值數(shù)字,可以使用字符類 [0123456789] 。但是,由于這樣使用字符不大方便,所以要通過在括號中使用連字符 - 來定義字符的范圍。連字符在字符類中有特殊的含義(不是在正則表達(dá)式中,因此,準(zhǔn)確地說它不能叫正則表達(dá)式元字符),且僅在連字符不是第一個字符時,連字符才在字符類中有特殊含義。要使用連字符指定任何數(shù)值數(shù)字,可以使用 [0-9] 。小寫字母也一樣,可以使用 [a-z] ,大寫字母可以使用 [A-Z] 。連字符定義的范圍取決于使用的字符集。因此,字符在(例如)ASCII 或 Unicode 表中出現(xiàn)的順序確定了在范圍中包括的字符。如果需要在范圍中包括連字符,將它指定為第一個字符。例如: [-.?] 將匹配 4 個字符中任何一個字符(注意,最后的字符是個空格)。另請注意,正則表達(dá)式元字符在字符類中不做特殊處理,所以這些元字符不需要轉(zhuǎn)義。考慮到字符類是與其他正則表達(dá)式語言分開的一種語言,因此字符類有自己的規(guī)則和語法。

如果使用字符 ^ 作為字符類的第一個字符來否定此類,也可以匹配字符類成員以外的任何字符。因此,要匹配任何非元音字符,可以使用字符類 [^aAeEiIoOuU] 。注意,如果要否定連字符,應(yīng)將連字符作為字符類的第二個字符,如 [^-] 。記住, ^ 在字符類中的作用與它在正則表達(dá)式模式中的作用完全不同。

下面列出操作中使用的一些字符類。

模式 輸入(匹配)

^b[aeiou]t$

Bat bet bit bot but

^[0-9]{5}$

11111 , 12345 , 99999

^c://

c:/windows c:///// c:/foo.txt c:/ 后跟任何其他內(nèi)容

abc$

abc 123abc abc 結(jié)束的任意字符串

(abc){2,3}

abcabc abcabcabc

^[^-][0-9]$

0 1 2 、... (不匹配 -0、-1、 -2 等)

在 .NET Framework 的下一版中,代碼名“Whidbey”作為一種新功能被添加到字符類中,稱作字符類差 (character class subtraction)。它的主要作用是,允許從一個字符類中減去另一個字符類,可提供更可讀的方式描述某些模式。該規(guī)范可通過以下地址訪問: http://www.gotdotnet.com/team/clr/bcl/TechArticles/techarticles/Specs/Regex/

CharacterClassSubtraction.doc 。它的語法類似 [a-z-[aeiou]] ,匹配所有的小寫輔音字母。

預(yù)定義的集合元字符

使用目前提供的工具可以完成很多工作。但是,要使用 [0-9] 表示模式中的每個數(shù)值數(shù)字,或(更糟)使用 [0 -9a -zA-Z] 表示任何字母數(shù)字字符,還有一段相當(dāng)漫長的過程。為了減輕處理這些常用但冗長模式的痛苦,事先定義了預(yù)定義元字符集合。正則表達(dá)式的不同實現(xiàn)定義了不同的預(yù)定義元字符集合,下面描述的預(yù)定義元字符集合在 .NET Framework 中得到 System.Text.RegularExpressions API 的支持。這些預(yù)定義元字符的標(biāo)準(zhǔn)語法是,在反斜杠 / 后跟一個或多個字符。多數(shù)預(yù)定義元字符只有一個字符,它們的使用很容易,是冗長字符類的理想替代字符。以下是兩個示例: /d 匹配所有數(shù)值數(shù)字, /w 匹配所有單詞字符(字母數(shù)字加下劃線)。例外情況是一些特定字符代碼匹配,此時必須指定所匹配字符的地址,如 /u000D 將匹配 Unicode 回車符。下面列出一些最常用的字符類及其等效的元字符。

元字符 等效字符類

/a

匹配鈴聲(警報);/u0007

/b

匹配字符類外的字邊界,它匹配退格字符,/u0008

/t

匹配制表符,/u0009

/r

匹配回車符,/u000D

/w

匹配垂直制表符,/u000B

/f

匹配換頁符,/u000C

/n

匹配新行,/u000A

/e

匹配轉(zhuǎn)義符,/u001B

/040

匹配 3 位 8 進(jìn)制 ASCII 字符。/040 表示空格(十進(jìn)制數(shù) 32)。

/x20

使用 2 位 16 進(jìn)制數(shù)匹配 ASCII 字符。此例中,/x2- 表示空格。

/cC

匹配 ASCII 控制字符,此例中是 ctrl-C。

/u0020

使用 4 位 16 進(jìn)制數(shù)匹配 Unicode 字符。此例中 /u0020 是空格。

/*

不代表預(yù)定義字符類的任意字符都只作為該字符本身對待。因此, /* 等同于 /x 2A (是文字 *,不是 * 元字符)。

/p{name}

匹配已命名字符類“name”中的任意字符。支持名稱是 Unicode 組和塊范圍。例如,Ll、Nd、Z、IsGreek、IsBoxDrawing 和 Sc(貨幣)。

/p{name}

匹配已命名字符類“name”中不包括的文本。

/w

匹配任意單詞字符。對于非 Unicode 和 ECMAScript 實現(xiàn),這等同于 [a-zA-Z_0-9] 。在 Unicode 類別中,這等同于 [/p{Ll}/p{Lu}/p{Lt}/p{Lo}/p{Nd}/p{Pc}]

/W

/w 的否定,等效于 ECMAScript 兼容集合 [^a-zA-Z_0-9] 或 Unicode 字符類別 [^/p{Ll}/p{Lu}/p{Lt}/p{Lo}/p{Nd}/p{Pc}]

/s

匹配任意空白區(qū)域字符。等效于 Unicode 字符類 [/f/n/r/t/v/x85/p{Z}] 。如果使用 ECMAScript 選項指定 ECMAScript 兼容方式,/s 等效于 [ /f/n/r/t/v] (請注意前導(dǎo)空格)。

/S

匹配任意非空白區(qū)域字符。等效于 Unicode 字符類別 [^/f/n/r/t/v/x85/p{Z}] 。如果使用 ECMAScript 選項指定 ECMAScript 兼容方式,/S 等效于 [^ /f/n/r/t/v] (請注意 ^ 后的空格)。

/d

匹配任意十進(jìn)制數(shù)字。在 ECMAScript 方式下,等效于 Unicode 的 [/p{Nd}] 、非 Unicode 的 [0-9]

/D

匹配任意非十進(jìn)制數(shù)字。在 ECMAScript 方式下,等效于 Unicode 的 [/p{Nd}] 、非 Unicode 的 [^0-9]

表達(dá)式示例

很多人都喜歡通過示例學(xué)習(xí),下面即提供一些表達(dá)式示例。要獲取更多示例,請訪問以下地址中的正則表達(dá)式聯(lián)機數(shù)據(jù)庫: http://www.regexlib.com/

模式 說明

^/d{5}$

5 個數(shù)值數(shù)字,如美國郵政編碼。

^(/d{5})|(/d{5}-/d{4}$

5 個數(shù)值數(shù)字或 5 個數(shù)字-短劃線-4 個數(shù)字。匹配 5 位數(shù)字格式的美國郵政編碼,或 5 位數(shù)字 + 4 位數(shù)字格式的美國郵政編碼。

^(/d{5}(-/d{4})?$

與前一個相同,但更有效。使用 ? 可使模式中的 4 位數(shù)字成為可選部分,而不是要求分別比較不同的兩個模式(通過另一種方式)。

^[+-]?/d+(/./d+)?$

匹配任意有可選符號的實數(shù)。

^[+-]?/d*/.?/d*$

與上一個相同,但也匹配空字符串。

^(20|21|22|23|[01]/d)[0-5]/d$

匹配 24 小時制時間值。

//*.*/*/

匹配 C 語言風(fēng)格的注釋 /* ... */

ASP.NET 中的驗證

ASP.NET 提供了一套驗證控件,與使用舊的(或愿意的話使用傳統(tǒng)的) ASP 處理任務(wù)相比,驗證控件使在 Web 窗體上驗證輸入變得非常容易。其中一個非常有效的驗證器是 RegularExpressionValidator ,如您所料,它允許您提供必須匹配輸入的正則表達(dá)式來驗證輸入。設(shè)置控件的 ValidationExpression 屬性可指定正則表達(dá)式的模式。下面顯示了驗證郵政代碼字段的驗證程序:

      <regularexpressionvalidator runat="server" id="ZipCodeValidator" controltovalidate="ZipCodeTextBox" errormessage="Invalid ZIP code format; format should be either 12345 or 12345-6789." validationexpression="(/d{5}(-/d{4})?"></regularexpressionvalidator>
    

使用 RegularExpressionValidator 要注意幾個問題:

?

決不要使用驗證程序要驗證的控件中的空字符串來激活驗證器。只有 RequiredFieldValidator 才可以捕獲空字符串。

?

您無需指定匹配字符的開始與結(jié)尾( ^ $ )- 它們是事先假設(shè)的。如果添加了開始與結(jié)尾,也沒有任何影響,不需要這樣做。

?

對于所有驗證控件來說,必須在客戶端以及服務(wù)器端進(jìn)行驗證。如果正則表達(dá)式不是 ECMAScript 兼容方式,客戶端驗證將失敗。為了避免這種情況,確保表達(dá)式是 ECMAScript 兼容方式,否則只在服務(wù)器端進(jìn)行控件驗證。

正則表達(dá)式 API

除了 ASP.NET 驗證控件,在.NET 中使用正則表達(dá)式的大多數(shù)情況都要使用 System.Text.RegularExpressions 命名空間中發(fā)現(xiàn)的類。特別是那些您希望熟悉的主類 Regex Match MatchCollection

順便說一下,正則表達(dá)式縮寫樣式 regex 的發(fā)音究竟是 /reg-eks/ 還是 /rej-eks/,還有一些爭議。本人傾向于后者,但兩種發(fā)音都有專家贊同,所以選擇哪個發(fā)音由您自己決定。

Regex 類有大量的方法和屬性,如果您以前沒有用過它,可能會感到無所適從。下面匯總了一些最常用的方法:

方法 說明

Escape / Unescape

字符串中的轉(zhuǎn)義元字符,用作表達(dá)式中的文字。

IsMatch

如果正則表達(dá)式在輸入字符串中發(fā)現(xiàn)匹配,返回“Ture”。

Match

如果在輸入字符串中發(fā)現(xiàn)匹配,則返回匹配對象。

Matches

如果在輸入字符串中發(fā)現(xiàn)包含任何或全部匹配,則返回匹配集合對象。

Replace

用給定的替換字符串替換輸入字符串中的匹配。

Split

將輸入字符串拆分成用正則表達(dá)式匹配分開的數(shù)組元素時,返回數(shù)組字符串。

除了指定很多方法外,還有一些選項可以指定,通常在 Regex 對象構(gòu)造函數(shù)中。由于這些選項是位屏蔽的一部分,或許可以同時指定這些選項(如,可以同時指定 Multiline 和 Singleline)。

方法 說明

Compiled

當(dāng)在循環(huán)中執(zhí)行許多匹配操作時使用此選項。這可以節(jié)省每一循環(huán)的分析表達(dá)式步驟。

Multiline

它與輸入字符串中的行數(shù)沒有關(guān)系。確切地說,它只修改 ^ $ 的方式,以便匹配行開始 (BOL) 和行結(jié)尾 (EOL),而不是匹配整個輸入字符串的開始和結(jié)尾。

IgnoreCase

使模式在匹配搜索字符串時忽略大小寫。

IgnorePatternWhitespace

允許根據(jù)需要在模式中包括任意數(shù)量的空白區(qū)域,也支持使用 (?# 注釋 #) 語法在模式中加入注釋。

SingleLine

它與輸入字符串中的行數(shù)沒有關(guān)系。更確切地說,它將導(dǎo)致 . (句點)元字符匹配任意字符,而不是除 /n 之外的任意字符(默認(rèn)情況)。

使用正則表達(dá)式常執(zhí)行的操作包括:驗證、匹配和替換。大多數(shù)情況下,可以使用 Regex 類的靜態(tài)方法完成這些操作,不需要實例化 Regex 類本身。要執(zhí)行驗證,全部要做的就是必建或找到正確的表達(dá)式,然后使用 Regex 類的 IsMatch() 方法將表達(dá)式應(yīng)用到輸入字符串中。例如,下面的函數(shù)演示了如何使用正則表達(dá)式驗證郵政編碼:

      private void ValidateZipButton_Click(object sender, System.EventArgs e){   String ZipRegex = @"^/d{5}___FCKpd___1quot;;   if(Regex.IsMatch(ZipTextBox.Text, ZipRegex))   {      ResultLabel.Text = "ZIP is valid!";   }   else   {      ResultLabel.Text = "ZIP is invalid!";   }}
    

類似的,可以使用靜態(tài) Replace() 方法將匹配替換為特定字符串,如下所示:

      String newText = Regex.Replace(inputString, pattern, replacementText);
    

最后,可以使用如下代碼遍歷輸入字符串的匹配集合:

      private void MatchButton_Click(object sender, System.EventArgs e){   MatchCollection matches = Regex.Matches(SearchStringTextBox.Text, MatchExpressionTextBox.Text);   MatchCountLabel.Text = matches.Count.ToString();   MatchesLabel.Text = "";   foreach(Match match in matches)   {      MatchesLabel.Text += "Found" + match.ToString() + " at position " + match.Index + ".
      
"; }}

通常,在您需要指定默認(rèn)方式以外的方式時,需要實例化 Regex 類的實例。特別是在設(shè)置選項時。例如,要創(chuàng)建忽略大小寫和模式空白區(qū)域的 Regex 實例,然后檢索與該表達(dá)式匹配的集合,則應(yīng)使用如下代碼:

      Regex re = new Regex(pattern, RegexOptions.IgnoreCase | RegexOptions.IgnorePatternWhitespace);MatchCollection mc = re.Matches(inputString);
    

本文的下載文件中包括這些示例的完整使用版本,與簡單 ASP.NET 頁中的一樣。

免費工具

Regulator ( http://royo.is-a-geek.com/iserializable/regulator/ ) - 一種在客戶端運行的正則表達(dá)式測試工具,通過 Web 服務(wù)與 RegexLib 緊密集成,提供對“匹配”、“拆分”和“替換”等的支持。包括性能分析和語法突出顯示功能。

RegexDesigner.NET ( http://www.sellsbrothers.com/tools/ ) - 一種功能強大的可視工具,可幫助構(gòu)造并測試正則表達(dá)式。它可生成 C# 和/或 VB.NET 代碼和已編譯匯編代碼,幫助您將表達(dá)式集成到應(yīng)用程序中。

Regular Expression Workbench (v2.0) ( http://www.gotdotnet.com/Community/UserSamples/Details.aspx?SampleGuid=C712F2DF-B026-4D58-8961-4EE2729D7322 ) - Eric Gunnerson 開發(fā)的工具,用于創(chuàng)建、測試和研究正則表達(dá)式。具有“Examine-o-matic”功能,允許將鼠標(biāo)懸停在正則表達(dá)式的上方,對其含義進(jìn)行解碼。

高級主題

正則表達(dá)式有兩個不得不說的功能,一個是“命名組”,另一個是“四向處理”(lookaround processing)。由于這些功能很少使用,此處只簡單闡述一下。

使用命名組,您可單獨命名匹配組,然后在表達(dá)式中使用程序語言引用這些組。如果結(jié)合 Replace 方法重新設(shè)置輸入字符串的格式(通過重新排列順序、替換輸入字符串中的元素),這個功能特別有效。例如,假設(shè)日期使用 MM/DD/YYYY 格式的字符串,而您希望日期格式是 DD-MM-YYYY。此時,可編寫一個表達(dá)式捕獲第一種格式,遍歷它的匹配集合,并分析每個字符串,然后使用字符串操作建立替換字符串。這需要大量的代碼和大量的處理。如果使用命名組,您可完成同樣的任務(wù),具體見下:

      String MDYToDMY(String input){   return Regex.Replace(intput, @"/b(?<month>/d{1,2})/(?<day>/d{1,2}</day></month>
    
      /(?<year>/d{4})/b", "${day}-${month}-${year}");}</year>
    

您還可以按編號或按名稱引用組。在任何情況下,這種引用通稱作“反向引用”。另一個經(jīng)常使用反向引用的場合在匹配表達(dá)式本身,如下這個表達(dá)式用于查找重復(fù)的字母: [a-z]/1 。它將匹配“aa”、“bb”、“cc”,但它不同于 [a-z]{2} [a-z][a-z] ,后兩者是等效的,后兩者允許匹配“ab”或“ac”或任何其他兩個字母的組合。反向引用允許表達(dá)式記住表達(dá)式已經(jīng)分析并匹配過的輸入字符串中的部分字符。

“四向處理”指很多正則表達(dá)式引擎所支持的正負(fù) Lookahead 和 Lookbehind 功能。并不是所有的正則表達(dá)式引擎都支持驗證四向處理。這些構(gòu)造不使用字符,即使它們可以匹配字符。有些模式可能在不使用四向處理的情況下無法描述。特別是當(dāng)模式中存在的一部分依賴于另一部分,如果不使用四向處理,則不能描述這樣的模式。下面介紹了每個四向處理的語法。

語法 說明

(?=...)

正 Lookahead

(?!...)

負(fù) Lookahead

(?

正 Lookbehind

(?

負(fù) Lookbehind

密碼驗證是必需四向處理的一個示例。假定在密碼限制中,密碼必須介于 4 到 8 個字符,且必須至少包含一個數(shù)字。為此,您可以僅在匹配中測試 /d ,然后使用字符串操作來測試長度。但要在正則表達(dá)式中實現(xiàn)這一切,必須使用 Lookahead。特別是正 lookahead,如下所示: ^(?=.*/d).{4,8}$

結(jié)論

正則表達(dá)式是一種描述文本模式的極有效方法,它使文本模式成為字符串驗證和操作的極好資源。.NET Framework 通過 System.Text.RegularExpressions 命名空間(特別是其中的 Regex 類)提供了對正則表達(dá)式的強大支持。使用 API 很簡單,但編寫正確的正則表達(dá)式通常比較費力。但幸運的是,正則表達(dá)式可以重復(fù)使用,您可以通過網(wǎng)絡(luò)中的各種聯(lián)機資源,從中找出其他人設(shè)計的表達(dá)式,或者在創(chuàng)建表達(dá)式遇到困難時得到幫助。

資源

正則表達(dá)式庫 http://www.regexlib.com/

正則表達(dá)式討論列表 http://aspadvice.com/login.aspx?ReturnUrl=%2fSignUp%2flist.aspx%3fl%3d68%26c%3d16&l=68&c=16

正則表達(dá)式論壇 http://forums.regexadvice.com/

正則表達(dá)式 Web 日志 http://blogs.regexadvice.com/

Mastering Regular Expressions (O'Reilly),作者 Jeffrey Friedl http://www.regex.info/

.NET 正則表達(dá)式參考 http://msdn.microsoft.com/library/en-us/cpref/html/frlrfSystemTextRegularExpressions.asp

Jscript 正則表達(dá)式語法 http://www.msdn.microsoft.com/library/en-us/script56/html/js56jsgrpRegExpSyntax.asp

正則表達(dá)式信息 http://www.regular-expressions.info/

作者簡介

Steven A. Smith 是 Microsoft 在 ASP.NET 技術(shù)方面的最有價值專家 (MVP),是 ASPAlliance.com 和 DevAdvice.com 的總裁和所有者。此外,他也是 ASPSmith Ltd(一家重點提供 .NET 培訓(xùn)的公司)的所有者和首席教師。他撰寫了兩本著作:“ASP.NET Developer's Cookbook”和“ASP.NET By Example”,并在 MSDN 和 AspNetPRO 雜志上發(fā)表了一些文章。Steve 每年都在各種會議上發(fā)表演講,是 INETA 聯(lián)絡(luò)處的成員。Steve 擁有企業(yè)管理碩士學(xué)位及計算機科學(xué)工程理學(xué)士學(xué)位。


引自: http://www.channel7.cn/2005/1-1/154042.html




ASP.NET 中的正則表達(dá)式


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 俄罗斯一级毛片免费视频 | 亚洲欧美日韩中文综合在线不卡 | 美日韩免费视频 | 精品一区二区三区视频在线观看 | 久久国产国内精品对话对白 | 亚洲欧美国产高清va在线播放 | 午夜免费福利在线观看 | 亚洲第一成年免费网站 | 9久热久re爱免费精品视频 | 国产成人精品视频 | 伊人黄色 | 欧美日韩中文字幕在线手机版本 | 亚洲小说春色综合另类网蜜桃 | 欧美国产一区二区三区 | 亚洲精品美女在线观看 | 欧美一级在线观看 | 青青草免费在线视频 | 精品国产91在线网 | 色婷婷综合和线在线 | 亚洲午夜在线观看 | 免费区一级欧美毛片 | 五月在线视频 | 欧美精品在线观看 | 五月国产综合视频在线观看 | 欧美一线视频 | 福利视频欧美一区二区三区 | 99热国产这里只有精品免费 | 狠狠色综合久久婷婷色天使 | 亚洲精品日本高清中文字幕 | 美女视频黄的免费视频网页 | 中文日韩字幕 | 奇米网在线视频 | 日本特交大片免费观看 | 国产一区二区久久精品 | 欧美夜夜片a | 欧美视频日韩专区午夜 | 久久99国产亚洲精品观看 | 国产综合色在线视频区色吧图片 | 久久精品三级视频 | 亚洲国产综合视频 | 久久综合综合 |