首页df_tmp = pd.DataFrame()

df_tmp = pd.DataFrame()

时间: 2024-06-13 07:04:41 浏览: 174

pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例

5星 · 资源好评率100%

代码如下，步骤流程在代码注释中可见： # -*- coding: utf-8 -*- import pandas as pd from pyspark.sql import SparkSession from pyspark.sql import SQLContext from pyspark import SparkContext #初始化数据 #初始化pandas DataFrame df = pd.DataFrame([[1, 2, 3], [4, 5, 6]], index=['row1', 'row2'], columns=['c1', 'c2', 'c3']) #打印数据 pri

根据提供的引用内容，df_tmp = pd.DataFrame()是创建一个空的DataFrame的语句。DataFrame是Pandas库中的一个数据结构，类似于Excel中的表格，可以用来存储和处理二维数据。在创建DataFrame时，可以通过传入数据、字典、列表等不同的数据类型来初始化。而在引用中，代码cols=df['測項'] df.drop("測項",axis=1,inplace=True) tmp_3 = pd.DataFrame(df.values.T,columns=cols)是将原始数据按列重新排列，并创建一个新的DataFrame。而引用中的代码演示了DataFrame中的loc和iloc两种索引方式的不同之处。loc是基于标签的索引，而iloc是基于位置的索引。通过这两种索引方式，可以对DataFrame进行数据的选择、修改和删除等操作。

阅读全文