RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

正則表達(dá)式(RegularExpression)使用指南

sanyue7758 ? 來源:芯片學(xué)堂 ? 2023-04-03 09:54 ? 次閱讀

芯片開發(fā)過程中,正則表達(dá)式的使用非常常見。初次上手晦澀難懂,多用幾次愛不釋手!

本文將概述正則表達(dá)式以及實(shí)用的匹配規(guī)則,并給出使用表達(dá)式的輔助工具:CheatSheet和在線測(cè)試工具。

01 正則表達(dá)式概述

正則表達(dá)式,Regular Expression,或縮寫regexp,是一種用于描述文本模式(pattern)的表達(dá)式。通過該文本模式,我們可以從文本中高效和準(zhǔn)確地匹配查找到想要的字符串。

正則表達(dá)式的搜索和匹配功能非常強(qiáng)大,以至于幾乎所有的腳本語言(比如Python, Perl,JavaScript),Java等高級(jí)編程語言,甚至grep等一些Linux命令,都支持正則表達(dá)式。

在芯片開發(fā)過程中,難免會(huì)有很多膠水腳本(glue script)用來串接各種流程,也就不可避免的需要對(duì)流程中產(chǎn)生的中間文件做處理,可能是提取、刪除或者修改內(nèi)容等等。另外,在代碼review、仿真調(diào)試等階段,通常需要對(duì)代碼或者仿真日志做信息檢索或數(shù)據(jù)有效性檢查。

而這些,都是正則表達(dá)式在芯片開發(fā)過程中大顯身手的地方。

02 Cheat Sheet

CheatSheet可作為日常工具手冊(cè),用戶可以快速地查閱正則表達(dá)式的匹配規(guī)則。不過,實(shí)際經(jīng)驗(yàn)告訴我,多用了幾次之后,常用的匹配規(guī)則也就都記住了。

015d3742-d13f-11ed-bfe3-dac502259ad0.png

03 常用關(guān)系特性

從CheatSheet可以直接看到正則表達(dá)式最基礎(chǔ)的匹配規(guī)則,包括匹配數(shù)字、字母、空白、通配符、開頭、結(jié)尾等等。但在實(shí)際使用中,還需要考慮一些匹配關(guān)系,這也是本小節(jié)想要呈現(xiàn)的內(nèi)容。

> 捕獲分組(capturing group)和非捕獲分組(non-capturing group)

在正則表達(dá)式中,可以使用圓括號(hào)對(duì)表達(dá)式進(jìn)行分組。在匹配完成后,就可以使用分組編號(hào)來對(duì)圓括號(hào)中的內(nèi)容進(jìn)行提取。默認(rèn)情況下,整個(gè)表達(dá)式的分組編號(hào)是0,之后從左往右每遇到一個(gè)”(”就分配一個(gè)遞增的分組編號(hào)。舉個(gè)栗子:

01a08970-d13f-11ed-bfe3-dac502259ad0.png

除了如上圖所示直接使用分組編號(hào)對(duì)匹配結(jié)果進(jìn)行索引,我們還可以在表達(dá)式內(nèi)進(jìn)行分組命名,這樣就可以是使用組名來進(jìn)行索引。舉個(gè)栗子:

01cf4efe-d13f-11ed-bfe3-dac502259ad0.png

非捕獲分組同樣使用小括號(hào)來進(jìn)行匹配,其格式是(?:exp)。非捕獲分組只能在當(dāng)前的位置匹配文本,不會(huì)被分配分組編號(hào),也即是說,在匹配完成之后無法通過分組編號(hào)對(duì)其進(jìn)行索引。

> 前向匹配(lookahead)和后向匹配(lookbehind)

前向匹配和后向匹配,嚴(yán)格來講也是非捕獲分組。在有些地方會(huì)叫做環(huán)視(lookaround),意味著在匹配的時(shí)候需要先“環(huán)顧四周”。前后向匹配在實(shí)際應(yīng)用中非常常用。

前向匹配(?=exp),用來匹配右邊跟著指定字符串的文本;后向匹配(?<=exp),用來匹配左邊跟著指定字符串的文本。舉個(gè)栗子,匹配2022年且日期為22號(hào)的月份:

01e94a48-d13f-11ed-bfe3-dac502259ad0.png

相反,通過把前后匹配表達(dá)式中的”=“改成”!”,即(?

> 貪婪匹配(greedy)和非貪婪匹配(non-greedy)

貪婪程度指的是正則表達(dá)式匹配停止的條件,貪婪模式會(huì)盡可能多的匹配,非貪婪模式會(huì)盡可能少的匹配。

默認(rèn)的匹配模式是貪婪模式,舉個(gè)栗子:d+可以匹配大于1個(gè)數(shù)字的字符串,那么針對(duì)被檢索文本“20220122”,正則表達(dá)式默認(rèn)盡可能多的匹配,即匹配整個(gè)“20220122”,因?yàn)樗紳M足“大于1個(gè)數(shù)字的字符串”這個(gè)pattern,而不是只匹配第一個(gè)數(shù)字“2”或匹配部分?jǐn)?shù)字“20220”。

非貪婪匹配也是非常常用的匹配模式,有些地方會(huì)叫做懶惰匹配(lazy),但都是一個(gè)意思:通過添加?來改變正則表達(dá)式匹配停止的條件。舉個(gè)栗子:

021cd94e-d13f-11ed-bfe3-dac502259ad0.png

04 測(cè)試工具

這里推薦正則表達(dá)式的在線測(cè)試工具。在該網(wǎng)站上,提供了正則表達(dá)式的使用參考,并且可以供用戶測(cè)試自己寫出來的正則表達(dá)式是否符合預(yù)期。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11292

    瀏覽量

    209328
  • JAVA
    +關(guān)注

    關(guān)注

    19

    文章

    2966

    瀏覽量

    104702
  • 編程語言
    +關(guān)注

    關(guān)注

    10

    文章

    1942

    瀏覽量

    34707
  • 腳本語言
    +關(guān)注

    關(guān)注

    0

    文章

    48

    瀏覽量

    8223
  • 正則表達(dá)式
    +關(guān)注

    關(guān)注

    0

    文章

    27

    瀏覽量

    3483

原文標(biāo)題:芯片開發(fā)必備工具 | 正則表達(dá)式(RegularExpression)使用指南

文章出處:【微信號(hào):處芯積律,微信公眾號(hào):處芯積律】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    什么是正則表達(dá)式?正則表達(dá)式如何工作?哪些語法規(guī)則適用正則表達(dá)式?

    正則表達(dá)式又稱規(guī)則表達(dá)式(Regular Expression,在代碼中常簡(jiǎn)寫為 regex、regexp 或 RE),是一種用于匹配、查找、替換文本的強(qiáng)大工具。它能夠以特定的模式匹配字符串,從而
    的頭像 發(fā)表于 11-03 14:41 ?3536次閱讀
    什么是<b class='flag-5'>正則表達(dá)式</b>?<b class='flag-5'>正則表達(dá)式</b>如何工作?哪些語法規(guī)則適用<b class='flag-5'>正則表達(dá)式</b>?

    shell正則表達(dá)式學(xué)習(xí)

    正則表達(dá)式在計(jì)算機(jī)科學(xué)中,是指一個(gè)用來描述或者匹配一系列符合某個(gè)句法規(guī)則的字符串的單個(gè)字符串。在很多文本編輯器或其他工具里,正則表達(dá)式通常被用來檢索和/或替換那些符合某個(gè)模式的文本內(nèi)容。許多
    發(fā)表于 07-25 17:18

    深入淺出boost正則表達(dá)式

    什么是正則表達(dá)式?正則表達(dá)式是一種用來描述一定數(shù)量文本的模式。Regex代表Regular Express. 如果您不知道什么是正則表達(dá)式,請(qǐng)看這篇文章:深入淺出之正則表達(dá)式
    發(fā)表于 09-08 18:09 ?9次下載

    PHP正則表達(dá)式

    PHP正則表達(dá)式,PHP建設(shè)必備的的工具,初學(xué)者簡(jiǎn)單易懂快速入門,高手進(jìn)階手冊(cè)。
    發(fā)表于 04-18 10:46 ?0次下載

    精通正則表達(dá)式

    詳細(xì)的快速正則表達(dá)式的查詢電子書,簡(jiǎn)單而豐富
    發(fā)表于 05-16 18:04 ?5次下載

    關(guān)于java正則表達(dá)式的用法詳解

    正則表達(dá)式 一個(gè)正則表達(dá)式是一個(gè)用于文本搜索的文本模式。換句話說,在文本中搜索出現(xiàn)的模式。例如,你可以用正則表達(dá)式搜索網(wǎng)頁中的郵箱地址或超鏈接。 正則表達(dá)式示例 下面是一個(gè)簡(jiǎn)單的Jav
    發(fā)表于 09-27 14:24 ?0次下載

    快速入門IPv6和正則表達(dá)式

    對(duì)于日常開發(fā)中只接觸IPv4,并沒有深入研究過正則表達(dá)式的開發(fā)者,面對(duì)IPv6和正則表達(dá)式,容易產(chǎn)生畏懼心理,覺得是兩座難以翻越的大山。本文通過一些表格整理對(duì)IPv6的表示方法,以及正則表達(dá)式的特殊符號(hào)進(jìn)行了分類和說明,帶領(lǐng)大家
    的頭像 發(fā)表于 03-30 09:31 ?8997次閱讀
    快速入門IPv6和<b class='flag-5'>正則表達(dá)式</b>

    Python正則表達(dá)式教程之標(biāo)準(zhǔn)庫的完整介紹及使用示例說明

    本文介紹了Python對(duì)于正則表達(dá)式的支持,包括正則表達(dá)式基礎(chǔ)以及Python正則表達(dá)式標(biāo)準(zhǔn)庫的完整介紹及使用示例。本文的內(nèi)容不包括如何編寫高效的正則表達(dá)式、如何優(yōu)化
    發(fā)表于 01-23 16:00 ?3次下載
    Python<b class='flag-5'>正則表達(dá)式</b>教程之標(biāo)準(zhǔn)庫的完整介紹及使用示例說明

    Python正則表達(dá)式的學(xué)習(xí)指南

    本文介紹了Python對(duì)于正則表達(dá)式的支持,包括正則表達(dá)式基礎(chǔ)以及Python正則表達(dá)式標(biāo)準(zhǔn)庫的完整介紹及使用示例。本文的內(nèi)容不包括如何編寫高效的正則表達(dá)式、如何優(yōu)化
    發(fā)表于 09-15 08:00 ?0次下載
    Python<b class='flag-5'>正則表達(dá)式</b>的學(xué)習(xí)<b class='flag-5'>指南</b>

    Python正則表達(dá)式指南

    本文介紹了Python對(duì)于正則表達(dá)式的支持,包括正則表達(dá)式基礎(chǔ)以及Python正則表達(dá)式標(biāo)準(zhǔn)庫的完整介紹及使用示例。本文的內(nèi)容不包括如何編寫高效的正則表達(dá)式、如何優(yōu)化
    發(fā)表于 03-26 09:13 ?10次下載
    Python<b class='flag-5'>正則表達(dá)式</b><b class='flag-5'>指南</b>

    C語言如何使用正則表達(dá)式

    C語言的正則表達(dá)式規(guī)則,特此跟大家分享。
    的頭像 發(fā)表于 03-16 08:41 ?4933次閱讀

    python正則表達(dá)式中的常用函數(shù)

    編譯正則表達(dá)式模式,返回一個(gè)正則對(duì)象的模式。(可以把那些常用的正則表達(dá)式編譯成正則表達(dá)式對(duì)象,這樣可以提高一點(diǎn)效率。)
    的頭像 發(fā)表于 03-18 16:12 ?1791次閱讀

    Linux入門之正則表達(dá)式

    正則表達(dá)式是用來表達(dá)字符串匹配模式的方法,利用正則表達(dá)式,可以讓我們輕易地實(shí)現(xiàn)對(duì)目標(biāo)字符串的**查找**、**刪除**、**替換**等操作。 正則表達(dá)式并不復(fù)雜,它并不包含難以理
    的頭像 發(fā)表于 05-12 15:31 ?873次閱讀
    Linux入門之<b class='flag-5'>正則表達(dá)式</b>

    shell腳本基礎(chǔ):正則表達(dá)式grep

    在Linux上有許多命令可以使用正則表達(dá)式,其中最常見的是grep命令和sed命令。正則表達(dá)式有多種類型,每種類型中可以使用的元字符類型不同。最常見的是基本正則表達(dá)式和擴(kuò)展正則表達(dá)式。
    的頭像 發(fā)表于 05-29 09:29 ?1251次閱讀
    shell腳本基礎(chǔ):<b class='flag-5'>正則表達(dá)式</b>grep

    Python中的正則表達(dá)式

    哈嘍大家好,我是了不起,今天給大家講Python中的正則表達(dá)式 在Python中,正則表達(dá)式是一種強(qiáng)大的文本處理工具,它可以用來匹配、搜索、替換文本。正則表達(dá)式是一個(gè)特殊的字符序列,它可以描述一類
    的頭像 發(fā)表于 06-21 16:52 ?983次閱讀
    RM新时代网站-首页