df=pd.read_table('./datingTestSet.txt',names=['fly','plat','eat','like']) df1=df.loc[:,['like']] x1=display(df1.loc[df['like'].str.endswith('largeDoses')].index) x2=df1.loc[df['like'].str.endswith('smallDoses')].index x3=df1.loc[df['like'].str.endswith('didntLike')].index print(x1,x2,x3)y = display(list(range(1, 1000))) y plt.scatter(x, y1, c = "yellow", marker='o',label='largeDoses')
时间: 2023-06-12 22:03:14 浏览: 268
gstreamer-java-src-1.5.zip_YUV raw_gstreamer_java gstreamer_plat
这段代码读入了一个文本文件,将数据存储在名为df的数据框中,并将列名设置为'fly'、'plat'、'eat'和'like'。然后,选择只包含'like'列的子数据框df1。接下来,使用str.endswith()方法和'largeDoses'、'smallDoses'和'didntLike'字符串来查找不同类别的数据的索引,并将它们存储在x1、x2和x3中。最后,使用Matplotlib的scatter()函数绘制散点图,并使用不同的颜色和标记来区分不同类别的数据点。但是,代码中的变量y没有定义,因此无法运行。
阅读全文