注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

零售创新,创新那些事儿,SPSS,VBA

零售创新

 
 
 

日志

 
 
关于我

新浪微博,零售创新 研究经理,数据分析师 希望和市场研究和零售业的同事共同进步! 本博客发表的都是免费或试用的资料,如果有版权问题请发邮件wangli12a@163.com联系删除。 spss excel vba blog

网易考拉推荐

Visual Studio 中使用的正则表达式 说明  

2013-10-11 21:10:12|  分类: VB和VBA知识 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
Visual Studio 中使用的正则表达式 说明 - 和平 - 零售创新,创新那些事儿,SPSS,VBA

 参考:详解Visual Studio正则替换大法

http://developer.51cto.com/art/200908/141835.htm


Visual Studio 中使用的正则表达式 说明

正则表达式是查找和替换文本模式的简洁和灵活的表示法。Visual Studio 中使用的正则表达式是 Visual C++ 6.0 中使用的、具有简化语法的表达式的超集。

查找在文件中查找在文件中替换对话框中,可使用下列正则表达式来改进和扩展搜索。

注意   在将下列任何表达式用作搜索条件的一部分之前,必须在查找在文件中查找在文件中替换对话框中选择使用复选框。

可使用下列表达式匹配搜索字符串中的字符或数字:

表达式

语法

说明

任一字符

.

匹配除换行符外的任何一个字符。

最多 0 项或更多

*

匹配前面表达式的 0 个或更多搜索项。

最多一项或更多

+

匹配前面表达式的至少一个搜索项。

最少 0 项或更多

@

匹配前面表达式的 0 个或更多搜索项,匹配尽可能少的字符。

最少一项或更多

#

匹配前面表达式的一个或更多搜索项,匹配尽可能少的字符。

重复 n

^n

匹配前面表达式的 n 个搜索项。例如,[0-9]^4 匹配任意 4 位数字的序列。

字符集

[]

匹配 [] 内的任何一个字符。要指定字符的范围,请列出由短划线 (-) 分隔的起始字符和结束字符,如 [a-z] 中所示。

不在字符集中的字符

[^...]

匹配跟在 ^ 之后的不在字符集中的任何字符。

行首

^

将匹配定位到行首。

行尾

$

将匹配定位到行尾。

词首

仅当词在文本中的此位置开始时才匹配。

词尾

仅当词在文本中的此位置结束时才匹配。

分组

()

将子表达式分组。

|

匹配 OR 符号 (|) 之前或之后的表达式。). 最常用在分组中。例如,(sponge|mud) bath 匹配“sponge bath”“mud bath”

转义符

\

匹配跟在反斜杠 (\) 后的字符。这使您可以查找在正则表达式表示法中使用的字符,如 { ^。例如,\^ 搜索 ^ 字符。

带标记的表达式

{}

标记括号内的表达式所匹配的文本。

n 个带标记的文本

\n

查找替换表达式中,指示第 n 个带标记的表达式所匹配的文本,其中 n 是从 1 9 的数字。

替换表达式中,\0 插入整个匹配的文本。

右对齐字段

\(w,n)

替换表达式中,将字段中第 n 个带标记的表达式右对齐至少 w 字符宽。

左对齐字段

\(-w,n)

替换表达式中,将字段中第 n 个带标记的表达式左对齐至少 w 字符宽。

禁止匹配

~(X)

X 出现在表达式中的此位置时禁止匹配。例如,real~(ity)    匹配“realty”“really”中的“real”,而不匹配“reality”中的“real”

字母数字字符

:a

匹配表达式
([a-zA-Z0-9])

字母字符

:c

匹配表达式
([a-zA-Z])

十进制数

:d

匹配表达式
([0-9])

十六进制数

:h

匹配表达式
([0-9a-fA-F]+)

标识符

:i

匹配表达式
([a-zA-Z_$][a-zA-Z0-9_$]*)

有理数

:n

匹配表达式
(([0-9]+.[0-9]*)| ([0-9]*.[0-9]+)| ([0-9]+)).

带引号的字符串

:q

匹配表达式 (("[^"]*")| ('[^']*'))

字母字符串

:w

匹配表达式
([a-zA-Z]+)

十进制整数

:z

匹配表达式
([0-9]+)

转义符

\e

Unicode U+001B

Bell

\g

Unicode U+0007

退格符

\h

Unicode U+0008

换行符

\n

匹配与平台无关的换行符。在替换表达式中,插入换行符。

制表符

\t

匹配制表符Unicode U+0009

Unicode 字符

\x#### \u####

匹配 Unicode 值给定的字符,其中 #### 是十六进制数。可以用 ISO 10646 代码点或两个提供代理项对的值的 Unicode 代码点指定基本多语种平面(即一个代理项)外的字符。

下表列出按标准 Unicode 字符属性进行匹配的语法。两个字母的缩写词与 Unicode 字符属性数据库中所列的一样。可将这些指定为字符集的一部分。例如,表达式 [:Nd:Nl:No] 匹配任何种类的数字。

表达式

语法

说明

大写字母

:Lu

匹配任何一个大写字母。例如,:Luhe 匹配“The”但不匹配“the”

小写字母

:Ll

匹配任何一个小写字母。例如,:Llhe 匹配“the”但不匹配“The”

词首大写字母

:Lt

匹配将大写字母和小写字母结合的字符,例如,Nj Dz

修饰符字母

:Lm

匹配字母或标点符号,例如逗号、交叉重音符和双撇号,用于表示对前一字母的修饰。

其他字母

:Lo

匹配其他字母,如哥特体字母 ahsa

十进制数

:Nd

匹配十进制数(如 0-9)和它们的双字节等效数。

字母数字

:Nl

匹配字母数字,例如罗马数字和表意数字零。

其他数字

:No

匹配其他数字,如旧斜体数字一。

开始标点符号

:Ps

匹配开始标点符号,例如左方括号和左大括号。

结束标点符号

:Pe

匹配结束标点符号,例如右方括号和右大括号。

左引号

:Pi

匹配左双引号。

右引号

:Pf

匹配单引号和右双引号。

破折号

:Pd

匹配破折号标记。

连接符号

:Pc

匹配下划线标记。

其他标点符号

:Po

匹配逗号 (,)?"!@#%&*\、冒号 (:)、分号 (;)' /

空白分隔符

:Zs

匹配空白。

行分隔符

:Zl

匹配 Unicode 字符 U+2028

段落分隔符

:Zp

匹配 Unicode 字符 U+2029

无间隔标记

:Mn

匹配无间隔标记。

组合标记

:Mc

匹配组合标记。

封闭标记

:Me

匹配封闭标记。

数学符号

:Sm

匹配 +=~| < >

货币符号

:Sc

匹配 $ 和其他货币符号。

修饰符号

:Sk

匹配修饰符号,如抑扬音、抑音符号和长音符号。

其他符号

:So

匹配其他符号,如版权符号、段落标记和度数符号。

其他控制

:Cc

匹配行尾。

其他格式

:Cf

格式化控制字符,例如双向控制字符。

代理项

:Cs

匹配代理项对的一半。

其他私用

:Co

匹配私用区域的任何字符。

其他未分配的字符

:Cn

匹配未映射到 Unicode 字符的字符。

除标准 Unicode 字符属性外,还可以指定下列附加属性。可将这些属性指定为字符集的一部分。

表达式

语法

说明

Alpha

:Al

匹配任何一个字符。例如,:Alhe 匹配“The”“then”“reached”等单词。

数字

:Nu

匹配任何一个数或数字。

标点符号

:Pu

匹配任何一个标点符号,如 ?@' 等等。

空白

:Wh

匹配所有类型的空格,包括印刷和表意文字的空格。

Bidi

:Bi

匹配诸如阿拉伯文和希伯来文这类从右向左书写的字符。

朝鲜文

:Ha

匹配朝鲜文和组合朝鲜文字母。

平假名

:Hi

匹配平假名字符。

片假名

:Ka

匹配片假名字符。

表意文字/汉字/日文汉字

:Id

匹配表意文字字符,如汉字和日文汉字

 

  评论这张
 
阅读(1003)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017