百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

高效文本处理之查找替换|各类工具+正则表达式或通配符使用

myzbx 2025-07-14 20:13 3 浏览

各工具在查找替换时可使用的正则表达式或通配符各有不同,可考虑使用的工具及特点有:

1 word,有丰富的查找替换选项;

2 notepad,可打开多个文档操作;

2 dreamweaver,较好支持正则表达式及多行查找操作;

4 python,使用正则表达式做查找替换时,功能强大;

如相同功能存在的一些细微区别:

分组替换 python是\1\2\3,dreamweaver是$1$2$3

段落标记:word使用^p,dreamweaver是\n或直接在文本框中按:shift+enter

1 word

word查找替换存在丰富的可选项组合:

特殊格式不同的对话框:

2 notepad

notepad支持在文件夹选择多个文件时,右击,可同时打开,并有“替换所有打开文件”的操作:

3 dreamweaver

dreamweaver的查找替换对话框,对于正则表达式有较好的支持:

简单解释以上正则表达式:

<p>(\d*[.]{1}\d*)(\s.)(.*?)</p>

[.]{1} 是指匹配英文句点.。

.*? 是指匹配除任意换行符以外的任意多字符。

可以直接作用多行文本:

4 python

当然,较复杂或需要完成较多的较固定的查找替换时,可以写一个简单的小程序,编程语言对于字符串操作支持都是其最基本的功能,而较容易使用的编程语言就是python了。

import sys
import os
import re

rInit = open('init.txt','rU',encoding='UTF-8')
wTemp = open('temp.txt','w',encoding="UTF-8")

nfn = str(rInit.readline()) # 第一行用作标题
nfn =nfn.replace("<p>","")
nfn =nfn.replace("</p>","")

s = rInit.read()                    # 整个文本文件作为一个字符串返回
s = s.replace(' ','')              # 处理全角空格
s = s.replace("<<","<<")
s = s.replace("#include <","#include <")
s = s.replace("#include<","#include<")
#s = s.replace(">",">")
s = s.replace(',?' , ',”')
s = s.replace('.?' , '.”')
s = s.replace('\n\r' , '\n')
s = s.replace('\r\n' , '\n')
s = s.replace('       ' , '\n\n')
s = re.sub(r'</div><div class="\w\d*">', '<p></p>', s)

rejiu =re.compile(r'<\S{,8}九\S{,22}</\S{,5}>') 
s = rejiu.sub("", s)

wTemp.write(nfn)                        # 标题写回
wTemp.write("\n")

wTemp.write(s)
rInit.close()
wTemp.close()

-End-

相关推荐

JMeter:执行顺序与作用域(jmeter顺序执行怎么设置)

一、执行顺序类似于运算符或操作符的优先级,当JMeter测试中包含多个不同的元素时,哪些元素先执行,哪些元素后执行,并不是严格按照它们出现的先后顺序依次有序执行的,而是会遵循一定的内部规则,我们称之为...

彻底搞懂C语言指针(c语言 指针用法)

指针是C语言的难点,本篇文章总结一下各类指针的用法。指针是个变量,它存储的是变量的地址,这个地址指向哪里,取决于指针的类型,指针类型包括以下几种:基本类型指针数组类型指针函数类型指针结构体类型指针联合...

Excel运算符相关知识点分享(excel运算符有哪些类型)

在Excel中,运算符主要用于执行各种计算和逻辑操作主要分为以下四类1.比较运算符在Excel中,比较运算符用于比较两个值,并返回逻辑结果TRUE(真)或FALSE(假)。它们常用于条件判...

Python编程基础:运算符的优先级(python运算符优先级记忆口诀)

多个运算符同时出现在一个表达式中时,先执行哪个,后执行哪个,这就涉及运算符的优先级。如数学表达式,有+、-、×、÷、()等,优先级顺序是()、×、÷、+、-,如5+(5-3)×4÷2,先计算(5-3)...

吊打面试官(四)--Java语法基础运算符一文全掌握

简介本文介绍了Java运算符相关知识,包含运算规则,运算符使用经验,特殊运算符注意事项等,全文5400字。熟悉了这些内容,在运算符这块就可以吊打面试官了。Java运算符的规则与特性1.贪心规则(Ma...

C语言零基础教学-3-运算符与表达式

同学们好,今天学习c元基础知识第三讲:运算符与表达式。本节内容将学习算数运算符与算数表达式。·至臻至减运算符、赋值运算符、逗号运算符、求至结运算符。→首先学习算数运算符,它包含加减乘除求余数正负。比如...

Python运算符优先级终极指南:避免表达式计算的陷阱

混合表达式中的运算符优先级当Python表达式中同时出现算术运算符、布尔运算符和比较运算符时,计算顺序由运算符优先级决定:算术运算符(最高优先级)包括:乘方(**)、乘除(*,/,//,%)、加...

Python自动化办公应用学习笔记12——运算符及运算符优先级

一、运算符1.算术运算符:运算符名称描述示例+加数值相加10+3=13-减数值相减10-3=7*乘数值相乘10*3=30/除浮点数除法10/3≈3.33//整除向下...

python3-运算符优先级(python运算符优先级最高)

#挑战30天在头条写日记#Python运算符优先级以下列出了从最高到最低优先级的所有运算符,相同单元格内的运算符具有相同优先级。运算符均指二元运算,除非特别指出。相同单元格内的运算符从左至右分组...

Java运算符优先级表(java语言中运算符的优先级)

Java语言中有很多运算符,由于运算符优先级的问题经常会导致程序出现意想不到的结果,为了避免程序可能由于运算顺序而导致一系列的问题,Java初学者需应尽可能掌握这些运算符规律图示给大家详细介绍了运算符...

Excel公式中运算符类型及优先顺序

在Excel中公式中,用到的一些运算符是有优先计算顺序的,详见下图。下面我们简单介绍一下这些运算符的使用方法。说明:Excel中所有公式及运算符,都需要在英文输入法半角状态输入,不要输入中文字符或者全...

JavaScript基础知识14——运算符:逻辑运算符,运算符优先级

哈喽,大家好,我是雷工!一、逻辑运算符1、概念:在程序中用来连接多个比较条件时候使用的符号。2、应用场景:在程序中用来连接多个比较条件时候使用。3、逻辑运算符符号:4、代码演示逻辑运算符的使用:逻辑...

认识Excel中的运算符(excel中的运算符包括在哪里)

Excel中,函数与公式无疑是最具有魅力的功能之一。使用函数与公式,能帮助用户完成多种要求的数据运算、汇总、提取等工作。函数与公式同数据验证功能相结合,能限制数据的输入内容或类型,还可以制作动态更新...

JavaScript 中的运算符优先级(javascript中的运算符分为哪几种?)

#寻找热爱表达的你#新人求关注,点击右上角↗关注,博主日更,全年无休,您的关注是我的最大的更新的动力~感谢大家了运算符优先级在JavaScript中是指决定表达式中不同操作符执行顺序的规...

从几个细节问题出发,如何写好产品需求文档?

来人人都是产品经理【起点学院】,BAT实战派产品总监手把手系统带你学产品、学运营。这篇文章暂时不讨论什么是需求文档,也不强调需求文档的重要性等等,就简单地从各种细节问题出发如何写好一份需求文档。一份好...