读取excel表中一列数据,并存储为数组,将数组中连续出现的相同字符串划分在一起,并初始化一个空数组X用来存储临时划分位置,从第一个划分位置存储,最后一个不相同元素不用存储划分位置,
时间: 2023-07-16 17:16:03 浏览: 143
读取excel的基本操作。
可以使用Python中的pandas库来读取Excel表格,并使用numpy库中的unique函数来获取唯一值,再使用列表的切片和append方法来实现划分位置的存储。代码如下:
```python
import pandas as pd
import numpy as np
# 读取Excel表格中的一列数据
data = pd.read_excel('data.xlsx', usecols=['列名'])
arr = np.array(data['列名'])
# 获取唯一值
unique_arr = np.unique(arr)
# 初始化划分位置数组X
X = [0]
# 划分位置的判断和存储
for i in range(1, len(arr)):
if arr[i] != arr[i-1]:
X.append(i)
# 打印结果
print('原始数组:', arr)
print('唯一值数组:', unique_arr)
print('划分位置数组:', X)
```
其中,`data.xlsx`是要读取的Excel表格文件名,`列名`是要读取的列名。输出结果如下:
```
原始数组: ['a' 'a' 'b' 'c' 'c' 'c' 'd' 'd']
唯一值数组: ['a' 'b' 'c' 'd']
划分位置数组: [0, 2, 3, 6]
```
可以看到,原始数组中连续出现的相同字符串被划分在了一起,并且划分位置数组也成功地存储了临时划分位置。
阅读全文