编写一个python ,按行读取txt文档,将里面的数字提取出来存一个列表
时间: 2023-02-26 22:07:10 浏览: 48
下面是一个示例代码:
```
with open("filename.txt", "r") as file:
lines = file.readlines()
numbers = []
for line in lines:
line = line.strip() # 去掉行末的换行符
for word in line.split():
try:
number = int(word)
numbers.append(number)
except ValueError:
pass # 如果不是数字,则跳过
print(numbers)
```
这段代码会读取 `filename.txt` 文件,然后逐行读取,并将每行中的数字提取出来并存储到列表 `numbers` 中。最后会打印出这个列表。
相关问题
用python编写一个读取pdf文档中所有文字的脚本
可以使用Python中的PyPDF2库来读取PDF文档中的文字,以下是一个示例脚本:
```
import PyPDF2
# 打开PDF文件
pdf_file = open('example.pdf', 'rb')
# 创建PDF阅读器对象
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# 获取PDF文件中页面的数量
num_pages = pdf_reader.getNumPages()
# 遍历每一页,并提取文本
for page in range(num_pages):
# 获取当前页对象
page_obj = pdf_reader.getPage(page)
# 提取当前页的文本
text = page_obj.extractText()
# 输出文本
print(text)
# 关闭文件
pdf_file.close()
```
在脚本中,我们首先打开PDF文件并创建一个PDF阅读器对象。然后,我们获取PDF文件中页面的数量,并遍历每一页。对于每一页,我们获取当前页对象并使用`extractText()`方法提取文本。最后,我们输出文本并关闭文件。
python如何编写提取excel文件并汇总到一个excel文档中
要提取多个Excel文件的内容并汇总到一个Excel文档中,你可以使用Python的pandas库来处理Excel文件。下面是一个示例代码,演示如何实现这个功能:
```python
import pandas as pd
import os
# 获取文件夹中所有的Excel文件
folder_path = '/path/to/folder'
excel_files = [file for file in os.listdir(folder_path) if file.endswith('.xlsx')]
# 创建一个空的DataFrame用于存储汇总数据
df_combined = pd.DataFrame()
# 逐个读取Excel文件并提取内容,并将数据追加到汇总DataFrame中
for file in excel_files:
file_path = os.path.join(folder_path, file)
df = pd.read_excel(file_path) # 使用pandas读取Excel文件
df_combined = df_combined.append(df, ignore_index=True) # 将数据追加到汇总DataFrame中
# 将汇总数据保存到一个新的Excel文件中
output_file = '/path/to/output.xlsx'
df_combined.to_excel(output_file, index=False)
print("数据已成功汇总到", output_file)
```
请将`/path/to/folder`替换为存放Excel文件的文件夹的路径,将`/path/to/output.xlsx`替换为输出的Excel文件路径和名称。此代码将读取该文件夹中所有以`.xlsx`结尾的Excel文件,并将它们的内容提取到一个汇总的DataFrame中。最后,将汇总数据保存到一个新的Excel文件中。
希望这个示例对你有帮助!如果你还有其他问题,请继续提问。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)