百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

这几种正则表达式的“字符集合”,想要入门regexp函数,必须了解

csdh11 2025-03-25 12:16 11 浏览

前言回顾:

大家好,今天我们来分几篇文章讲讲REGEXP正则表达式函数中的正则表达式字符,因为只有掌握了这些字符之后,我们才能结合具体实际需求,编写REGEXP函数的第二参数,将各类符号进行连接组合使用,实现对复杂文本进行匹配、提取和替换的目的。


REGEXP函数是基于正则表达式,对复杂文本进行匹配、提取和替换的函数。


基本语法结构

REGEXP(原始字符串,正则表达式,[匹配模式],[替换内容])


匹配模式是可选项,0或忽略表示提取,1表示判断是否包含,2表示替换。

替换内容是可选项,仅在匹配模式为2时有效,用来替换匹配的内容。


常用的正则表达式核心符号主要大体分为六大类


1.基础元字符



2.量词符



3.定位符



4.字符集合



5.分组与引用



6.特殊符号




今天我们主要讲讲第四大类字符集合这个大类的符号还比较好理解


我们再来结合几个具体的小例子,并运用REGEXP函数代入,感受一下字符集合的含义与作用。




[abc]表示匹配 a、b、c 中的任意一个字符


输入函数公式

=REGEXP(A2,"[ac]")


可以将A2单元格字符串中包含a与c的字母提取,显示出来。


当然了,也可以判断a与c是否存在于A2单元格中,还可以查找a与c,替换为指定的其他值(替换为空即删除)。



[^abc]表示匹配除a、b、c以外的其他字符


输入函数公式

=REGEXP(A2,"[^ac]")


可以将A2单元格字符串中除a与c以外的其他字符提取出来。



[a-z]表示匹配小写字母a到z,即匹配到所有的小写字母


输入函数公式

=REGEXP(A2,"[a-z]")


可以提取到A2单元格字符串中所有的小写字母。



[A-Z0-9]表示匹配大写字母和数字的组合


输入函数公式:

=REGEXP(A2,"[A-Z0-9]")


可以提取到A2单元格字符串中所有的大写字母和数字。



[特殊符号]表示匹配特定符号(需转义或直接写入)


比如说[\+\-*/]表示匹配加减乘除符号,因为加减乘除符号在正则表达式中可能存在特殊的含义与作用,要与加减乘除符号本身相区分的话,必须要在各个符号前面加上符号“\”,符号“\”就是我们常说的转义符。


输入函数公式

=REGEXP(A2,"[\+\-\*\/]")


就可以将A2单元格字符串中包含+-*/(加减乘除)的符号提取出来显示。

当然了,也可以判断+-*/是否存在于A2单元格中,还可以查找+-*/,替换为指定的其他值(替换为空即删除)。



下面我们继续用几个简单的职场实际案例,继续深入理解集合符的具体作用!


案例1

例如我们想要将A列各个单元格中的手机号码提取出来。手机号码有几种格式,一种是包含空格间隔的手机号码,一些是用符号“-”间隔的手机号码,剩余的为正常的手机号码。


我们可以这样输入正则表达式函数

=REGEXP(A2,"[0-9\-\s+]{11,}")

或=REGEXP(A2,"[0-9\-\ ]{11,}")


正则表达式符号含义

[0-9\-\s+]:表示匹配数字、横线-(须加转义符\)或空格

其中\s+:表示1个或多个空格。 红色底色处代表敲击一个空格键产生的,也表示空格。

{11,}:表示至少11位,以适应数量不等的分隔符。




案例2

例如我们想要判断A列各个单元格的产品编号是否含有规则为:"3位大写字母+3位数字+1位大写字母" 的这种信息部分。


我们可以这样输入正则表达式函数

=REGEXP(A2,"[A-Z]{3}-[0-9]{3}-[A-Z]",1)


正则表达式符号含义

[A-Z]{3}:代表3位大写字母。

[0-9]{3}:代表3位数字。

[A-Z]:代表1位大写字母


这样“编号XQD-456-F国产”符合规则,返回TRUE;“编号abc-123-x进口”不符合规则,返回FALSE。




案例3

A列数据是用户账号信息,平台允许只能由字母、数字、下划线组成。我们想要删除文本中的非字母、数字、下划线的字符(如@、#等)。即清理非法字符。


我们可以这样输入正则表达式

=REGEXP.REPLACE(A1, "[^A-Za-z0-9_]", "")


正则表达式符号含义:

[^A-Za-z0-9_]:匹配非字母、数字、下划线的字符


替换为空字符串,实现清理删除目的。




案例4

我们想要提取A列各单元格中的日期数据。日期数据包含两种格式,提取格式为 YYYY/MM/DD 或 YYYY-MM-DD 的日期。


我们可以这样输入函数公式

=REGEXP(A2,"\d{4}[-/]\d{1,2}[-/]\d{1,2}")


正则表达式符号解析

\d{4}:4位年份

[-/]:匹配横线 - 或斜杠 /

\d{1,2}:匹配1位数或2位数的月份或日。


相关推荐

NUS邵林团队发布DexSinGrasp基于强化学习实现物体分离与抓取统一

本文的作者均来自新加坡国立大学LinSLab。本文的共同第一作者为新加坡国立大学实习生许立昕和博士生刘子轩,主要研究方向为机器人学习和灵巧操纵,其余作者分别为硕士生桂哲玮、实习生郭京翔、江泽宇以及...

「PLC进阶」如何通过编写SCL语言程序实现物料分拣?

01、前言SCL作为IEC61131-3编程语言的一种,由于其高级语言的特性,特别适合复杂运算、复杂数学函数应用的场合。本文以FactoryIO软件中的物料分拣案例作为硬件基础,介绍如何通过SCL来实...

zk源码—5.请求的处理过程一(http1.1请求方法)

大纲1.服务器的请求处理链...

自己动手从0开始实现一个分布式 RPC 框架

前言为什么要自己写一个RPC框架,我觉得从个人成长上说,如果一个程序员能清楚的了解RPC框架所具备的要素,掌握RPC框架中涉及的服务注册发现、负载均衡、序列化协议、RPC通信协议、Socket通信、异...

MLSys’25 | 极低内存消耗:用SGD的内存成本实现AdamW的优化性能

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,...

线程池误用导致系统假死(线程池会自动销毁吗)

背景介绍在项目中,为了提高系统性能使用了RxJava实现异步方案,其中异步线程池是自建的。但是当QPS稍微增大之后却发现系统假死、无响应和返回,调用方出现大量超时现象。但是通过监控发现,系统线程数正常...

大型乘用车工厂布局规划(六大乘用车基地)

乘用车工厂的布局规划直接影响生产效率、物流成本、安全性和未来扩展能力。合理的布局应确保生产流程顺畅、物流高效、资源优化,并符合现代化智能制造和绿色工厂的要求。以下是详细的工厂布局规划要点:1.工厂布...

西门子 S7-200 SMART PLC 连接Factory IO的方法

有很多同学不清楚如何西门子200smart如何连接FactoryIO,本教程为您提供了如何使用西门子S7-200SMARTPLC连接FactoryIO的说明。设置PC和PLC之间的...

西门子博图高级仿真软件的应用(西门子博途软件仿真)

1.博图高级仿真软件(S7-PLCSIMAdvancedV2.0)S7-PLCSIMAdvancedV2.0包含大量仿真功能,通过创建虚拟控制器对S7-1500和ET200SP控制器进行仿真...

PLC编程必踩的6大坑——请对号入座,评论区见

一、缺乏整体规划:面条式代码问题实例:某快递分拣线项目初期未做流程图设计,工程师直接开始编写传送带控制程序。后期增加质检模块时发现I/O地址冲突,电机启停逻辑与传感器信号出现3处死循环,导致项目延期2...

统信UOS无需开发者模式安装软件包
统信UOS无需开发者模式安装软件包

原文链接:统信UOS无需开发者模式安装软件包...

2025-05-05 14:55 csdh11

100个Java工具类之76:数据指纹DigestUtils

为了提高数据安全性,保证数据的完整性和真实性,DigestUtils应运而生。正确恰当地使用DigestUtils的加密算法,可以实现数据的脱敏,防止数据泄露或篡改。...

麒麟KYLINIOS软件仓库搭建02-软件仓库添加新的软件包

#秋日生活打卡季#原文链接:...

Java常用工具类技术文档(java中工具类的作用)

一、概述Java工具类(UtilityClasses)是封装了通用功能的静态方法集合,能够简化代码、提高开发效率。本文整理Java原生及常用第三方库(如ApacheCommons、GoogleG...

软路由的用法(自动追剧配置)(软路由教学)

本内容来源于@什么值得买APP,观点仅代表作者本人|作者:值友98958248861环境和需求...