for line in inputfile_list.readlines(): file_name = line.strip('\n')# 使用strip()函数去掉每行结束的\n if file_name: m1 = re.match("^(\S+)-(\d{2})_(CP\d)-(\S+)$", file_name) # SCWX505A1_C056868.00_C056868.00-02_CP3-RP0_2023JAN15042101_dlogTDO.csv if m1: print (int((m1.group(2))))# 获取匹配的字符,括号里面是分组序号,没有序号则获取整体 wafernum = int((m1.group(2))) m2 = re.match("^(\S+)\.(\S+)$", file_name) # SCWX505A1_C056868.00_C056868.00-04_CP3-RP0_RP1_Merge.xlsx if m2: print (m2.group(1)) file_name_m = m2.group(1)
时间: 2023-06-26 07:04:30 浏览: 102
这段代码是读取一个文件列表,逐行处理每个文件名。首先使用正则表达式匹配文件名中的特定部分,如果匹配成功,则打印出第二个匹配到的分组内容,或者将第二个分组内容转换为整数赋值给变量wafernum。如果第一个正则表达式没有匹配成功,则使用第二个正则表达式匹配文件名,打印出第一个匹配到的分组内容并赋值给变量file_name_m。
相关问题
#Web元素提取 def getHTML(htmlpath): #读取HTML文件内容 f=open(htmlpath,'r',encoding='utf-8') ls=f.readlines() f.close() return ls def extractImageUrls(htmllist): #解析文件并提取图像的URL urls=[] for line in htmllist: if 'img'in line: #图像用img标签表示 url=line.split('src=')[-1].split('"')[1] if 'http' in url: #每个URL都以http开头 urls.append(url) return urls def showResults(urls): #将获取的链接输出 for url in urls: url1=url.strip().split('\t') name='20180112025424524.png' if name in urls: print('png图像文件为:20180112025424524.png对应的URL为:{}'.format(url1)) def saveResults(filepath,urls): #保存结果到文件 f=open(filepath,'w') for url in urls: f.write(url+'\n') f.close() def main(): inputfile="C:\Users\86183\Downloads\nationalgeographic.html" outputfile='nationalgeographic.txt' htmlLines=getHTML(inputfile) imagUrls=extractImageUrls(htmlLines) showResults(imagUrls) saveResults(outputfile,imagUrls) main() 如何修改这段Python代码,使其实现用print实现如下输出: 图像列表中,png图像文件为:20180112025424524.png 对应的URL为:http://image.nationalgeographic.com.cn/2018/0112/20180112025424524.png
您可以将showResults函数修改为以下代码:
```
def showResults(urls):
for url in urls:
if '20180112025424524.png' in url:
print("图像列表中,png图像文件为:20180112025424524.png 对应的URL为:{}".format(url))
```
使用 input 函数获取文件名; 要读取的文件位于文件夹 file,文件夹 file 的路径为src/step1/file; 读取文件中每一行的内容,打印包含每一行内容的列表。
在Python中,你可以使用`input()`函数获取用户输入的文件名,然后结合这个名称去特定目录(在这个例子中是`src/step1/file`)下读取文件。下面是一个示例,展示了如何逐行读取文件内容并打印成列表:
```python
# 获取用户输入的文件名
file_name = input("请输入要读取的文件名: ")
# 指定文件所在路径
file_path = os.path.join("src", "step1", "file", file_name)
try:
with open(file_path, 'r') as file:
lines = file.readlines() # 逐行读取文件内容
content_list = [line.strip() for line in lines] # 去除每行末尾的换行符并存储为列表
print("文件内容列表:", content_list)
except FileNotFoundError:
print(f"无法找到文件: {file_path}")
阅读全文