编写一个python代码可以从年报文件中获取公司业务概况及对应页码
时间: 2024-02-29 08:53:29 浏览: 68
python来分析一些财务报表数据
5星 · 资源好评率100%
好的,以下是一个简单的 Python 代码,可以从年报文件中获取公司业务概况及对应页码:
```python
import PyPDF2
# 打开年报文件
with open('annual_report.pdf', 'rb') as pdf_file:
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# 获取年报总页数
total_pages = pdf_reader.getNumPages()
# 循环遍历每一页
for page_num in range(total_pages):
page = pdf_reader.getPage(page_num)
page_text = page.extractText()
# 搜索业务概况关键字
if '业务概况' in page_text:
# 获取业务概况所在页码
business_summary_page = page_num + 1
# 获取业务概况文本内容
business_summary_text = page_text[page_text.index('业务概况'):]
next_page_text = pdf_reader.getPage(page_num + 1).extractText()
business_summary_text += next_page_text[:next_page_text.index('主要财务指标')]
# 打印业务概况及对应页码
print('业务概况所在页码:', business_summary_page)
print('业务概况文本内容:', business_summary_text)
```
请将 `annual_report.pdf` 替换为你要处理的年报文件的文件名,并确保你已经安装了 PyPDF2 库。此代码将搜索包含“业务概况”关键字的页面,并输出业务概况的文本内容及其所在的页码。
阅读全文