xlsfile=pd.read_csv('000002.SZ.csv').iloc[:,1:].values in_=np.hstack([xlsfile[:-1,:],xlsfile[1:,:-1]]) out_=xlsfile[1:,-1:] print(in_) print(out_) m=-480 train_data = in_[:m,:] test_data = in_[m:,:] train_label = out_[:m,:] test_label = out_[m:,:]
时间: 2024-01-14 17:05:09 浏览: 73
这段代码的作用是读取名为 "000002.SZ.csv" 的文件,并将除了第一列以外的数据存储在xlsfile中。然后,使用NumPy库中的hstack函数,将xlsfile的前一行和后一行水平堆叠在一起,形成输入数据in_。out_是xlsfile中的最后一列数据,即输出数据。接着,使用切片对in_和out_进行分割,将前480个数据用于训练,剩余的数据用于测试。最后,将输入和输出数据分别存储在train_data、train_label和test_data、test_label中。
相关问题
xlsfile=pd.read_csv('000002.SZ.csv').iloc[:,1:].values in_=np.hstack([xlsfile[:-1,:],xlsfile[1:,:-1]]) out_=xlsfile[1:,-1:] print(in_) print(out_)
这段代码的作用是读取名为'000002.SZ.csv'的CSV文件,然后将其转换为NumPy数组。接下来,将数组中的每一行与它下一行拼接在一起,形成一个新的数组in_,其中最后一列被排除在外。同时,将原数组中除第一行外的所有行的最后一列提取出来,形成一个新的数组out_。
最后,这段代码会输出in_和out_两个数组的内容。
import pandas as pd df=pd.read_csv('D:/20230706/sdssSpecPhoto.csv') df1=df.sort_values(by="ra",ascending=True) df2=df1.drop_duplicates(subset=['ra','dec'],keep='first',inplace=False) df3=df2.iloc[:,1:3] df3.to_csv("D:/20230706/sdss_corrdinate1.csv") df4=pd.read_csv("D:/20230706/sdss_ALLWISE.csv",index_col=0)
您已经成功导入了 Pandas 库,并使用 `pd.read_csv` 函数读取了名为 'D:/20230706/sdssSpecPhoto.csv' 的 CSV 文件,将其存储在名为 'df' 的 DataFrame 中。
接下来,您对 DataFrame 'df' 进行了排序操作,按照 'ra' 列的值进行升序排序,并将结果存储在名为 'df1' 的新 DataFrame 中。
然后,您使用 `drop_duplicates` 函数在 'df1' DataFrame 上去除了重复的行,基于 'ra' 和 'dec' 列的值进行判断,并保留第一次出现的行。这一操作的结果被存储在名为 'df2' 的新 DataFrame 中。
接着,您使用 `iloc` 方法从 'df2' DataFrame 中选取了所有行和第1、2列的数据,并将结果存储在名为 'df3' 的新 DataFrame 中。
随后,您使用 `to_csv` 方法将 'df3' DataFrame 中的数据写入到名为 'D:/20230706/sdss_corrdinate1.csv' 的 CSV 文件中。
最后,您使用 `pd.read_csv` 函数读取了名为 'D:/20230706/sdss_ALLWISE.csv' 的 CSV 文件,并将其存储在名为 'df4' 的 DataFrame 中,并将第一列作为索引列。
阅读全文
相关推荐
















