data.loc[:,data.dtypes.values=="int64"].shape[1]

这段代码是用于获取DataFrame中整型数据列的数量。其中，`data.dtypes`返回了DataFrame中每一列数据的数据类型，`.values`将其转化为一个NumPy数组，`=="int64"`会返回一个布尔型数组，用于过滤出数据类型为int64的列，最后使用`.shape[1]`获取满足条件的列的数量。可以将这段代码拆分为以下几步： ```python # 获取DataFrame中每一列数据的数据类型 dtypes = data.dtypes # 将数据类型转化为NumPy数组 dtypes_array = dtypes.values # 获取数据类型为int64的列 int64_columns = dtypes_array == "int64" # 获取满足条件的列的数量 num_int64_columns = int64_columns.sum() ``` 或者更简单地： ```python num_int64_columns = (data.dtypes.values == "int64").sum() ``` 注意，这段代码中需要先导入pandas库，因为DataFrame是pandas库中的一种数据结构。

for i in range (data.loc[:,data.dtypes.values=="int64"].shape[1]): data.loc[i,data.dtypes.values=="int64"]= data.loc[i,data.dtypes.values=="int64"].apply(lambda x: float(x))

这段代码的作用是将DataFrame中的整型数据转化为浮点型数据。具体实现如下： 1. `data.loc[:,data.dtypes.values=="int64"]` 会先获取DataFrame中所有数据类型为int64的列； 2. `data.loc[i,data.dtypes.values=="int64"]` 会获取第i列数据类型为int64的数据； 3. `data.loc[i,data.dtypes.values=="int64"].apply(lambda x: float(x))` 会将第i列数据类型为int64的数据中的每个元素都转化为浮点型数据。这里使用了apply()方法，apply()会对Series中的每个元素都执行指定的操作，lambda x: float(x)表示将每个元素都转化为浮点型数据； 4. 最后将转化后的浮点型数据赋值回原始DataFrame中。需要注意的是，这段代码中的循环实际上是对DataFrame中的每一列都执行了一遍相同的操作，因此可以使用applymap()方法来简化代码，如下所示： ```python data.loc[:, data.dtypes.values == "int64"] = data.loc[:, data.dtypes.values == "int64"].applymap(float) ``` 这样就可以将DataFrame中所有数据类型为int64的数据都转化为浮点型数据了。

import numpy as np import pandas as pd import matplotlib.pyplot as plt plt.rcParams['font.sans-serif']=["SimHei"] #单使用会使负号显示错误 plt.rcParams['axes.unicode_minus']=False #把负号正常显示 # 读取北京房价数据 path='data.txt' data=pd.read_csv(path,header=None,names=['mianji','jiage']) # data.head() # data.describe() # 绘制散点图 data.plot(kind='scatter',x='mianji',y='jiage') plt.show() def computeCost(X,y,theta): inner=np.power((Xtheta.T),2) return np.sum(inner)/(2len(X)) data.insert(0,'Ones',1) clos=data.shape[1] X=data.iloc[:,0:clos-1] y=data.iloc[:,clos-1:clos] X=np.array(X.values) y=np.array(y.values) theta=np.array[0,0] computeCost(X,y,theta) def gradientDescent(X,y,theta,alpha,iters): temp=np.array(np.zeros(theta.shape)) parameters=int(theta.ravel().shape[1]) cost=np.zeros(iters) for i in range(iters): error=(Xtheta.T)-y for j in range(parameters): term=np.multiply(error,X[:,j]) temp[0,j]=theta[0,j]-((alpha/len(X))np.sum(term)) theta=temp cost[i]=computeCost(X,y,theta) return theta,cost alpha=0.01 iters=1000 g,cost=gradientDescent(X,y,theta,alpha,iters) x=np.linspace(data.mianji.min(),data.mianji.max(),100) f=g[0,0]+(g[0,1]*x) fig,ax=plt.subplots(figsize=(12,8)) ax.plot(x,f,'r',label='北京房价') ax.scatter(data.mianji,data.jiage,label='Traning data') ax.legend(loc=4) ax.set_xlabel('房子面积') ax.set_ylabel('房子价格') ax.set_title("北京房价格回归图") plt.show()

在这段代码中，有几个错误： 1. 第一行和第二行之间应该有一个空行。 2. 导入numpy和pandas模块时，应该使用import语句，每个模块之间应该有一个空行。 3. 在第10行和11行中，应该将plt.rcParams的设置放在import语句之后。 4. 在第14行中，应该将data.insert(0,'Ones',1)改为data.insert(0,'Ones',np.ones(len(data)))，以便将1插入到整个列中。 5. 在第16行中，应该将clos改为cols，因为该变量代表“列数”。 6. 在第18行中，应该将theta=np.array[0,0]改为theta=np.array([0,0])，以便创建一个2个元素的数组。 7. 在第25行和26行之间应该有一个空行。 8. 在第27行中，应该将parameters=int(theta.ravel().shape[0])改为parameters=int(theta.ravel().shape[1])，因为该数组是一个2x1的数组。 9. 在第36行中，应该将g,cost=gradientDescent(X,y,theta,alpha,iters)改为g,cost=gradientDescent(X,y,theta,alpha,int(iters))，以确保iters是一个整数。 10. 在第38行和39行之间应该有一个空行。以下是修正后的代码： ``` import numpy as np import pandas as pd import matplotlib.pyplot as plt plt.rcParams['font.sans-serif'] = ["SimHei"] # 单使用会使负号显示错误 plt.rcParams['axes.unicode_minus'] = False # 把负号正常显示 # 读取北京房价数据 path = 'data.txt' data = pd.read_csv(path, header=None, names=['mianji', 'jiage']) # data.head() # data.describe() # 绘制散点图 data.plot(kind='scatter', x='mianji', y='jiage') plt.show() def computeCost(X, y, theta): inner = np.power((X * theta.T - y), 2) return np.sum(inner) / (2 * len(X)) data.insert(0, 'Ones', np.ones(len(data))) # 将1插入到整个列中 cols = data.shape[1] X = data.iloc[:, 0:cols-1] y = data.iloc[:, cols-1:cols] X = np.array(X.values) y = np.array(y.values) theta = np.array([0, 0]) # 创建一个2个元素的数组 computeCost(X, y, theta) def gradientDescent(X, y, theta, alpha, iters): temp = np.array(np.zeros(theta.shape)) parameters = int(theta.ravel().shape[1]) cost = np.zeros(iters) for i in range(iters): error = (X * theta.T) - y for j in range(parameters): term = np.multiply(error, X[:, j]) temp[0, j] = theta[0, j] - ((alpha / len(X)) * np.sum(term)) theta = temp cost[i] = computeCost(X, y, theta) return theta, cost alpha = 0.01 iters = 1000 g, cost = gradientDescent(X, y, theta, alpha, int(iters)) # 确保iters是一个整数 x = np.linspace(data.mianji.min(), data.mianji.max(), 100) f = g[0, 0] + (g[0, 1] * x) fig, ax = plt.subplots(figsize=(12, 8)) ax.plot(x, f, 'r', label='北京房价') ax.scatter(data.mianji, data.jiage, label='Traning data') ax.legend(loc=4) ax.set_xlabel('房子面积') ax.set_ylabel('房子价格') ax.set_title("北京房价格回归图") plt.show() ```

阅读全文

data.loc[:,data.dtypes.values=="int64"].shape[1]

for i in range (data.loc[:,data.dtypes.values=="int64"].shape[1]): data.loc[i,data.dtypes.values=="int64"]= data.loc[i,data.dtypes.values=="int64"].apply(lambda x: float(x))

相关推荐

blog.loc:我的博客OOP PHP

srm.loc:启动backbone_srm - 添加文件

kpd-100.loc:html KPD-100工厂

爬取https://nba.hupu.com/stats/players网址中的骑士队球员的比赛数据，并使用分布雷达可视化图表将其呈现。

利用backtrader进行股票强化学习，完整代码

机器学习（三）感知器算法实现鸢尾花

pirosmani.loc:基于视频的网站布局

python pandas.DataFrame.loc函数使用详解

汇编批量反C相关说明(1).docx

kpd-stroi.loc：семейный-дв.рф

大家在看

JESD47I中文版.docx

sdram 资料 原理。

运算放大器的设计及ADS仿真设计——两级运算放大器仿真设计

《Web服务统一身份认证协议设计与实现》本科毕业论文一万字.doc

[C#]文件中转站程序及源码

最新推荐

OpenCV部署YOLOv5-pose人体姿态估计（C++和Python双版本）.zip

HTML挑战：30天技术学习之旅

【CodeBlocks精通指南】：一步到位安装wxWidgets库（新手必备）

andorid studio 配置ERROR: Cause: unable to find valid certification path to requested target

VC++实现文件顺序读写操作的技巧与实践

【大数据时代必备：Hadoop框架深度解析】：掌握核心组件，开启数据科学之旅

opencv的demo程序

NeuronTransportIGA: 使用IGA进行神经元材料传输模拟

【Linux多系统管理大揭秘】：专家级技巧助你轻松驾驭

fofa和fofa viewer的区别

sdram 资料原理。