文件600000.txt中存放的是代码为60000股票的价格数据,具体格式是dale,open,high,low,close,vol mount,分别代表了日期,开盘价,最高价,最低价,收些价,交易量和交易额。我们只关心收盘价。我们现在把这些数据做一个处理,计算出每天的张跌幅,计算公式是(当天收盘价-上一天的收盘价)/上一天的收盘价,这样算出来的是一个[0.1,0.1]之间的一个数值。我们把这些数据做一个处理,,转换成[0,20]之间的整数整数。也就是说如果前面的数值是-0.1(表示跌去了10%),那么就转换成0;如果前面的数值是0.1(表示涨了10%),那就转换成20。那么我们原来的收盘价数据,就变成了一串[0,20]之间的整数数字。训练数据使用前80%的数据,对后20%的数据进行验证。python编程
时间: 2024-02-16 19:03:11 浏览: 24
以下是Python代码实现:
```python
# 读取文件
with open('600000.txt', 'r') as f:
lines = f.readlines()
# 处理数据
prices = []
for line in lines:
data = line.strip().split(',')
close_price = float(data[4])
prices.append(close_price)
changes = []
for i in range(1, len(prices)):
change = (prices[i] - prices[i-1]) / prices[i-1]
changes.append(change)
int_changes = []
for change in changes:
if change < -0.1:
int_change = 0
elif change > 0.1:
int_change = 20
else:
int_change = int((change + 0.1) / 0.01)
int_changes.append(int_change)
# 划分训练集和验证集
train_data = int_changes[:int(len(int_changes)*0.8)]
val_data = int_changes[int(len(int_changes)*0.8):]
print(train_data)
print(val_data)
```
首先,我们读取文件,将每天的收盘价存储在一个列表中。然后,我们计算每天的涨跌幅,并将其存储在另一个列表中。接着,我们将每天的涨跌幅转换成整数,并将其存储在第三个列表中。最后,我们根据80/20的比例划分训练集和验证集,并打印出来。