for i in df.sort_values(by='销量').iloc[-20:, :].values[::-1]: name.append(i[1]) values.append(i[5])

这段代码的作用是： 1. 调用 DataFrame 对象 df 的 sort_values() 方法，按照“销量”列的值进行降序排列。 2. 调用 iloc[] 方法，选择“销量”列值排名前 20 的行，并选取所有列的值。这里使用了负数索引，表示从后往前选取行，[::-1] 表示将选出的行倒序排序。 3. 遍历选中的每一行数据，将其“名称”和“销量”列的值分别添加到名为 name 和 values 的列表中。最终的效果是，将 DataFrame 对象 df 中“销量”排名前 20 的数据的名称和销量值分别存储在两个列表中，以便后续的数据可视化操作。

import pandas as pd df=pd.read_csv('D:/20230706/sdssSpecPhoto.csv') df1=df.sort_values(by="ra",ascending=True) df2=df1.drop_duplicates(subset=['ra','dec'],keep='first',inplace=False) df3=df2.iloc[:,1:3] df3.to_csv("D:/20230706/sdss_corrdinate1.csv") df4=pd.read_csv("D:/20230706/sdss_ALLWISE.csv",index_col=0)

您已经成功导入了 Pandas 库，并使用 `pd.read_csv` 函数读取了名为 'D:/20230706/sdssSpecPhoto.csv' 的 CSV 文件，将其存储在名为 'df' 的 DataFrame 中。接下来，您对 DataFrame 'df' 进行了排序操作，按照 'ra' 列的值进行升序排序，并将结果存储在名为 'df1' 的新 DataFrame 中。然后，您使用 `drop_duplicates` 函数在 'df1' DataFrame 上去除了重复的行，基于 'ra' 和 'dec' 列的值进行判断，并保留第一次出现的行。这一操作的结果被存储在名为 'df2' 的新 DataFrame 中。接着，您使用 `iloc` 方法从 'df2' DataFrame 中选取了所有行和第1、2列的数据，并将结果存储在名为 'df3' 的新 DataFrame 中。随后，您使用 `to_csv` 方法将 'df3' DataFrame 中的数据写入到名为 'D:/20230706/sdss_corrdinate1.csv' 的 CSV 文件中。最后，您使用 `pd.read_csv` 函数读取了名为 'D:/20230706/sdss_ALLWISE.csv' 的 CSV 文件，并将其存储在名为 'df4' 的 DataFrame 中，并将第一列作为索引列。

忽略该脚本警告 import pandas as pd import glob def com(): file_paths = glob.glob('E:/py卓望/数据分析/top150_20230321/*.txt') data = pd.DataFrame() for i in file_paths: df = pd.read_csv(i, sep=',', header=None, skiprows=[0]) data = pd.concat([data, df]) data.drop(df.columns[0], axis=1, inplace=True) df.sort_values(by=1, ascending=False, inplace=True) data.iloc[:, 0] = data.iloc[:, 0].str.lower() data.to_csv('E:/py卓望/数据分析/all/all_file.txt', sep=',', index=False,header=False) all = pd.read_csv('E:/py卓望/数据分析/all/all_file.txt', header=None, delimiter=',') all[0] = all[0].str.split('.') all[0] = all[0].apply( lambda x: '.'.join(x[-3:]) if '.'.join(x[-2:]) in ['gov.cn', 'com.cn', 'org.cn', 'net.cn'] else '.'.join(x[-2:])) new_col = all[0] result = pd.concat([new_col,all.iloc[:,1:]],axis=1) result.to_csv('E:/py卓望/数据分析/all/二级域名.txt', sep=',',index=False,header=False) summation = pd.read_csv('E:/py卓望/数据分析/all/二级域名.txt', header=None, delimiter=',') grouped = summation.groupby(0)[1].sum().reset_index() grouped = grouped.sort_values(by=1, ascending=False).reset_index(drop=True) grouped[1] = grouped[1].fillna(summation[1]) grouped.to_csv('E:/py卓望/数据分析/all/处理后求和域名.txt', sep=',', index=False, header=False) top_10000 = pd.read_csv('E:/py卓望/数据分析/all/处理后求和域名.txt', header=None, delimiter=',') alls = top_10000.nlargest(10000, 1) alls.drop(columns=[1], inplace=True) alls.to_csv('E:/py卓望/数据分析/all/data.txt', sep=',',index=False, header=False) final = top_10000.iloc[10000:] final.drop(columns=[1], inplace=True) final.to_csv('E:/py卓望/数据分析/all/final_data.txt', sep=',',index=False, header=False) print(final.to_csv) warnings.filterwarnings("ignore") def main(): com() if name == "main": print("开始清洗域名文件") main() print("数据清洗完毕")

要忽略该脚本中的警告，可以在脚本开头添加以下两行代码： ```python import warnings warnings.filterwarnings("ignore") ``` 这会忽略脚本中的所有警告。将这两行代码添加到脚本的开头即可： ```python import pandas as pd import glob import warnings def com(): warnings.filterwarnings("ignore") file_paths = glob.glob('E:/py卓望/数据分析/top150_20230321/*.txt') data = pd.DataFrame() for i in file_paths: df = pd.read_csv(i, sep=',', header=None, skiprows=[0]) data = pd.concat([data, df]) data.drop(df.columns[0], axis=1, inplace=True) df.sort_values(by=1, ascending=False, inplace=True) data.iloc[:, 0] = data.iloc[:, 0].str.lower() data.to_csv('E:/py卓望/数据分析/all/all_file.txt', sep=',', index=False,header=False) all = pd.read_csv('E:/py卓望/数据分析/all/all_file.txt', header=None, delimiter=',') all[0] = all[0].str.split('.') all[0] = all[0].apply( lambda x: '.'.join(x[-3:]) if '.'.join(x[-2:]) in ['gov.cn', 'com.cn', 'org.cn', 'net.cn'] else '.'.join(x[-2:])) new_col = all[0] result = pd.concat([new_col,all.iloc[:,1:]],axis=1) result.to_csv('E:/py卓望/数据分析/all/二级域名.txt', sep=',',index=False,header=False) summation = pd.read_csv('E:/py卓望/数据分析/all/二级域名.txt', header=None, delimiter=',') grouped = summation.groupby(0)[1].sum().reset_index() grouped = grouped.sort_values(by=1, ascending=False).reset_index(drop=True) grouped[1] = grouped[1].fillna(summation[1]) grouped.to_csv('E:/py卓望/数据分析/all/处理后求和域名.txt', sep=',', index=False, header=False) top_10000 = pd.read_csv('E:/py卓望/数据分析/all/处理后求和域名.txt', header=None, delimiter=',') alls = top_10000.nlargest(10000, 1) alls.drop(columns=[1], inplace=True) alls.to_csv('E:/py卓望/数据分析/all/data.txt', sep=',',index=False, header=False) final = top_10000.iloc[10000:] final.drop(columns=[1], inplace=True) final.to_csv('E:/py卓望/数据分析/all/final_data.txt', sep=',',index=False, header=False) print(final.to_csv) def main(): print("开始清洗域名文件") com() print("数据清洗完毕") if __name__ == "__main__": main() ``` 这样就可以在运行脚本时忽略所有警告了。

阅读全文

for i in df.sort_values(by='销量').iloc[-20:, :].values[::-1]: name.append(i[1]) values.append(i[5])

相关推荐

PHP实现商品按销量价格升降序排序

5.Pandas_Cheat_Sheet.pdf

-saylani-pandas-class-4:saylani-pandas-class-4

df_nav_u = df_NAV[df_NAV['组合名称']==u] df_nav_u = df_nav_u.sort_values(by='持仓日期', ascending=True) 获取df最后一行，净值(无税费)列的值

df.sort_values(['roundTime'],ascending = [True],inplace = True) A value is trying to be set on a copy of a slice from a DataFrame

Data-Analysis-Manipulation-Introduction-to-Colab:教程

Pandas-Data-Analysis-in-Python:Pandas是最强大的数据分析库。 总的来说，我们使用熊猫来正确地分析数据，这是数据科学的绝佳工具

pd.read_csv返回值用法

基于STM32单片机的激光雕刻机控制系统设计-含详细步骤和代码

白色简洁风格的前端网站模板下载.zip

HarmonyException如何解决.md

大家在看

STM8L051F3P6使用手册（中文）.zip

华为2403安装手册.

TwinCAT3.1学习笔记

新代plc资料

先栅极还是后栅极 业界争论高K技术

最新推荐

Python数据科学速查表 - Pandas 基础.pdf

pandas大数据分析笔记.docx

基于STM32单片机的激光雕刻机控制系统设计-含详细步骤和代码

白色简洁风格的前端网站模板下载.zip

WildFly 8.x中Apache Camel结合REST和Swagger的演示

管理建模和仿真的文件

【声子晶体模拟全能指南】：20年经验技术大佬带你从入门到精通

2024-07-27怎么用python转换成农历日期

FDFS客户端Python库1.2.6版本发布

"互动学习：行动中的多样性与论文攻读经历"

Pandas-Data-Analysis-in-Python:Pandas是最强大的数据分析库。总的来说，我们使用熊猫来正确地分析数据，这是数据科学的绝佳工具

先栅极还是后栅极业界争论高K技术