Python 找到目录下的所有文件
时间: 2023-04-02 08:01:51 浏览: 105
你可以使用 os 模块中的 listdir() 函数来列出目录下的所有文件和文件夹,然后使用 os.path 模块中的 isfile() 函数来判断是否为文件,最后使用列表推导式来筛选出所有的文件。示例代码如下:
```python
import os
def get_files(path):
files = [os.path.join(path, f) for f in os.listdir(path) if os.path.isfile(os.path.join(path, f))]
return files
# 示例
files = get_files('/path/to/directory')
print(files)
```
相关问题
python 爬取url 目录下所有文件
你可以使用 Python 的 requests 库和 BeautifulSoup 库来爬取一个 URL 目录下的所有文件。
首先,你需要使用 requests 库来获取目录页面的 HTML 内容。然后,使用 BeautifulSoup 库来解析 HTML,找到所有链接,过滤出文件链接,然后使用 requests 库下载这些文件。
以下是一个简单的代码示例:
```python
import os
import requests
from bs4 import BeautifulSoup
url = 'http://example.com/files/'
# 获取目录页面的 HTML 内容
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 遍历所有链接,找到文件链接并下载
for link in soup.find_all('a'):
href = link.get('href')
if href.endswith('.pdf'): # 这里仅下载 PDF 文件,你可以根据实际情况修改
file_url = url + href
file_name = href.split('/')[-1]
response = requests.get(file_url)
with open(file_name, 'wb') as f:
f.write(response.content)
print(f'Downloaded {file_name}')
```
注意,这个代码示例仅适用于非认证目录,如果你需要认证,你需要修改 requests 库的请求头和参数等。
在Linux下使用python找到目录下所有的word文件
可以使用Python的os和glob库来解决这个问题。具体操作步骤如下:
1. 使用os库的listdir函数获取目标目录下的所有文件名
2. 使用包含*.docx的glob模式过滤出所有word文件名
3. 遍历所有word文件名,做相应的处理(如读取文件内容等)
以下是Python代码示例:
import os
import glob
directory = '/path/to/your/directory'
# 获取目录下的所有文件名
all_files = os.listdir(directory)
# 过滤出所有word文件
word_files = glob.glob(directory + '/*.docx')
# 遍历所有word文件
for file in word_files:
# 处理文件,例如读取文件内容
with open(file, 'r') as f:
content = f.read()
print(content)