使用Python读取Excel第一列第二行之后的浮点型数据,并把他们指定为离散型
时间: 2024-02-25 20:54:47 浏览: 88
python使用pandas处理大数据节省内存技巧(推荐)
可以使用Python中的openpyxl库来读取Excel文件,并使用离散化技术将连续型数据转化为离散型数据。以下是一个示例代码,演示如何读取Excel文件中第一列第二行之后的浮点型数据,并将其按照等宽离散化的方法转化为离散型数据:
```python
import openpyxl
import numpy as np
# 打开Excel文件
wb = openpyxl.load_workbook('example.xlsx')
# 选择需要读取的工作表
ws = wb['Sheet1']
# 读取第一列第二行之后的数据
data = [cell.value for cell in ws['A2':'A'+str(ws.max_row)]]
# 将浮点型数据按照等宽离散化的方法转化为离散型数据
bin_edges = np.linspace(min(data), max(data), num=10)
discretized_data = np.digitize(data, bin_edges)
# 打印转化后的数据
print(discretized_data)
```
在上述代码中,我们使用了openpyxl库来读取Excel文件,并使用了numpy库的digitize()方法来将浮点型数据离散化为离散型数据。具体来说,我们首先读取了第一列第二行之后的浮点型数据,然后使用numpy库的linspace()方法生成了一组等宽的区间,接着使用digitize()方法将浮点型数据映射到对应的离散值上。最后,我们打印出转化后的离散型数据。
阅读全文