用python 提取文件名包含‘text‘的excel文档,并且打印出内容
时间: 2024-03-03 12:52:43 浏览: 30
以下是一个提取文件名包含'text'的Excel文档并打印内容的Python代码示例:
```python
import os
import glob
import pandas as pd
# 设置需要读取的文件夹路径
folder_path = 'your_folder_path'
# 获取文件夹中所有Excel文件路径
files = glob.glob(os.path.join(folder_path, "*.xls*"))
# 遍历每个Excel文件
for file in files:
# 获取文件名
filename = os.path.basename(file)
# 判断文件名是否包含'text'
if 'text' in filename:
# 读取Excel文件
df = pd.read_excel(file)
# 打印Excel内容
print(df)
```
首先,设置需要读取的文件夹路径。然后,使用glob和os模块获取文件夹中所有Excel文件的路径。接下来,遍历每个Excel文件,获取文件名并判断是否包含'text'。如果包含,使用pandas库的read_excel函数读取Excel文件,并且打印Excel内容。
相关问题
按照属性包含指定文本提取excel中的数据,如何使用python实现
可以使用Python中的pandas库来实现按照属性包含指定文本提取excel中的数据。具体实现步骤如下:
1. 使用pandas库中的read_excel函数读取excel文件,将其转换为DataFrame格式。
2. 使用DataFrame的str.contains方法来筛选包含指定文本的行。
3. 使用DataFrame的loc方法来提取筛选后的数据。
以下是示例代码:
```python
import pandas as pd
# 读取excel文件
df = pd.read_excel('data.xlsx')
# 筛选包含指定文本的行
contains_text = '属性'
filtered_df = df[df['列名'].str.contains(contains_text)]
# 提取筛选后的数据
result = filtered_df.loc[:, ['列名1', '列名2']]
# 输出结果
print(result)
```
其中,'data.xlsx'为要读取的excel文件名,'列名'为要筛选的列名,'列名1'和'列名2'为要提取的列名。
python提取dwg文件中的文本放到excel中
要在Python中提取DWG文件中的文本并将其放入Excel中,可以使用开源库`ezdxf`和`openpyxl`来实现。
首先,需要安装这两个库。可以使用`pip`命令进行安装:
```
pip install ezdxf openpyxl
```
然后,导入所需的库:
```python
import ezdxf
from openpyxl import Workbook
```
接下来,使用`ezdxf`库来读取DWG文件并提取文本。可以使用`readfile()`函数读取DWG文件,然后使用`modelspace().textflow()`方法获取所有的文本内容:
```python
doc = ezdxf.readfile("input.dwg")
msp = doc.modelspace()
texts = []
for entity in msp:
if entity.dxftype() == 'TEXT':
texts.append(entity.dxf.text)
```
然后,创建一个新的Excel文件,并将提取的文本数据写入Excel的工作表中。可以使用`openpyxl`库来实现:
```python
workbook = Workbook()
sheet = workbook.active
for i, text in enumerate(texts):
sheet.cell(row=i+1, column=1).value = text
workbook.save("output.xlsx")
```
以上就是使用Python提取DWG文件中的文本并将其放入Excel的简单示例。你可以将输入的DWG文件名替换为你自己的文件名,然后运行这段代码来实现提取和导出文本的功能。