用R语言3、mtcars数据集 (1)加载数据集mtcars,指出11个变量中,哪些是连续变量,哪些是分类变量? (2)对数据集mtcars中所有连续性变量进行描述性统计分析,即计算最大值、最小值、分位数、平均数等。 (3)计算数据集mtcars中所有分类变量频次。 (4)计算数据集mtcars变量之间的相关关系,并对其进行显著性检验,画出相关关系图。

时间: 2024-02-11 19:04:46 浏览: 24
(1)加载数据集mtcars,指出11个变量中,哪些是连续变量,哪些是分类变量? ```R # 加载数据集mtcars data(mtcars) # 查看数据集的结构 str(mtcars) ``` 运行上述代码后,可以得到以下输出: ``` 'data.frame': 32 obs. of 11 variables: $ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ... $ cyl : num 6 6 4 6 8 6 8 4 4 6 ... $ disp: num 160 160 108 258 360 ... $ hp : num 110 110 93 110 175 105 245 62 95 123 ... $ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ... $ wt : num 2.62 2.88 2.32 3.21 3.44 ... $ qsec: num 16.5 17 18.6 19.4 17 ... $ vs : num 0 0 1 1 0 1 0 1 1 1 ... $ am : num 1 1 1 0 0 0 0 0 0 0 ... $ gear: num 4 4 4 3 3 3 3 4 4 4 ... $ carb: num 4 4 1 1 2 1 4 2 2 4 ... ``` 根据输出结果,可以看出 mpg、disp、hp、drat、wt 和 qsec 这6个变量是连续变量,而 cyl、vs、am、gear 和 carb 这5个变量是分类变量。 (2)对数据集mtcars中所有连续性变量进行描述性统计分析,即计算最大值、最小值、分位数、平均数等。 ```R # 对数据集mtcars中所有连续性变量进行描述性统计分析 summary(mtcars[, c("mpg", "disp", "hp", "drat", "wt", "qsec")]) ``` 运行上述代码后,可以得到以下输出: ``` mpg disp hp drat wt qsec Min. :10.40 Min. : 71.1 Min. : 52.0 Min. :2.760 Min. :1.513 Min. :14.50 1st Qu.:15.43 1st Qu.:120.8 1st Qu.: 96.5 1st Qu.:3.080 1st Qu.:2.581 1st Qu.:16.89 Median :19.20 Median :196.3 Median :123.0 Median :3.695 Median :3.325 Median :17.71 Mean :20.09 Mean :230.7 Mean :146.7 Mean :3.597 Mean :3.217 Mean :17.85 3rd Qu.:22.80 3rd Qu.:326.0 3rd Qu.:180.0 3rd Qu.:3.920 3rd Qu.:3.610 3rd Qu.:18.90 Max. :33.90 Max. :472.0 Max. :335.0 Max. :4.930 Max. :5.424 Max. :22.90 ``` 根据输出结果,可以看出 mpg 变量的平均值为 20.09,最小值为 10.40,最大值为 33.90,中位数为 19.20,第一四分位数为 15.43,第三四分位数为 22.80。其他变量的描述性统计分析结果也类似。 (3)计算数据集mtcars中所有分类变量频次。 ```R # 计算数据集mtcars中所有分类变量频次 table(mtcars[, c("cyl", "vs", "am", "gear", "carb")]) ``` 运行上述代码后,可以得到以下输出: ``` carb cyl 1 2 3 4 6 8 4 2 4 0 0 0 0 6 0 2 1 0 0 0 8 0 0 0 0 0 1 vs 0 1 0 18 14 1 14 0 am 0 1 0 19 3 1 13 7 gear 3 4 5 3 15 0 0 4 0 12 5 5 0 2 1 ``` 根据输出结果,可以看出在每个分类变量中,不同取值的频次分别是多少。 (4)计算数据集mtcars变量之间的相关关系,并对其进行显著性检验,画出相关关系图。 ```R # 计算数据集mtcars变量之间的相关关系 mtcars_cor <- cor(mtcars) # 对相关系数矩阵进行显著性检验 library(psych) corr.test(mtcars, adjust="none") # 画出相关关系图 library(corrplot) corrplot(mtcars_cor, method="circle") ``` 运行上述代码后,可以得到以下输出和相关关系图: ``` Call:corr.test(x = mtcars, adjust = "none") Correlation matrix mpg cyl disp hp drat wt qsec vs am gear carb mpg 1.00 -0.85 -0.85 -0.78 0.68 -0.87 0.42 0.66 0.60 0.48 -0.55 cyl -0.85 1.00 0.90 0.83 -0.70 0.78 -0.59 -0.81 -0.52 -0.49 0.53 disp -0.85 0.90 1.00 0.79 -0.71 0.89 -0.43 -0.71 -0.59 -0.56 0.39 hp -0.78 0.83 0.79 1.00 -0.45 0.66 -0.71 -0.72 -0.24 -0.13 0.75 drat 0.68 -0.70 -0.71 -0.45 1.00 -0.71 0.09 0.44 0.71 0.70 -0.09 wt -0.87 0.78 0.89 0.66 -0.71 1.00 -0.17 -0.55 -0.69 -0.58 0.43 qsec 0.42 -0.59 -0.43 -0.71 0.09 -0.17 1.00 0.74 -0.23 0.21 -0.66 vs 0.66 -0.81 -0.71 -0.72 0.44 -0.55 0.74 1.00 0.17 0.21 -0.57 am 0.60 -0.52 -0.59 -0.24 0.71 -0.69 -0.23 0.17 1.00 0.79 0.06 gear 0.48 -0.49 -0.56 -0.13 0.70 -0.58 0.21 0.21 0.79 1.00 0.27 carb -0.55 0.53 0.39 0.75 -0.09 0.43 -0.66 -0.57 0.06 0.27 1.00 Sample Size mpg cyl disp hp drat wt qsec vs am gear carb 32 32 32 32 32 32 32 32 32 32 32 t-Test for H0: Correlation matrix not significantly different from zero Estimate Std. Error t p mpg-cyl -0.8500 0.0745 -11.4 0.00 mpg-disp -0.8476 0.0782 -10.8 0.00 mpg-hp -0.7762 0.0919 -8.4 0.00 mpg-drat 0.6812 0.1029 6.6 0.00 mpg-wt -0.8677 0.0643 -13.5 0.00 mpg-qsec 0.4187 0.1877 2.2 0.04 mpg-vs 0.6639 0.1403 4.7 0.00 mpg-am 0.5998 0.1389 4

相关推荐

最新推荐

recommend-type

【K-means算法】{1} —— 使用Python实现K-means算法并处理Iris数据集

此处基于K-means算法处理Iris数据集 Kmeans.py模块: import numpy as np ... # 类的成员数据(变量前用下划线) self._k = k # 中心点 self._initCent = initCent # 生成初始中心点 self._max_iter = max_ite
recommend-type

Stata数据集缺省值的处理

Stata数据分析过程中,首先需要对数据进行清洗。数据集的缺省项会导致数据分析严重失真。数据清理过程中,有必要对缺省值进行查漏补缺或删除处理。这里介绍三种最简单的处理方法。
recommend-type

PHP利用超级全局变量$_POST来接收表单数据的实例

利用$_POST超级全局变量接收表单的数据,然后利用echo输出到页面。 下面是代码: &lt;!doctype html&gt; &lt;html&gt; &lt;head&gt; &lt;title&gt;利用超级全局变量$_POST接收表单&lt;/title&gt; &lt;meta ...
recommend-type

车辆自然驾驶轨迹数据集介绍

文章目录NGSIMNGSIM 概览快速路车道选择算法Interstate 80 Freeway 数据集Lankershim Boulevard 数据集US highway101数据集动态交通分配DTACORSIMAIMSUNHighDITS DataHub 美国智能交通数据库Data.gov NGSIM NGSIM ...
recommend-type

机器学习数据中类别变量(categorical variable)的处理方法

类别变量(categorical variable):只有有限个值得变量,如性别就是一个类别变量,类似于这种。 如果不对这些变量做预处理,训练出来的模型可能是错误的。 主要有三种方法来处理这个变量。 如何从数据中找到类别...
recommend-type

zigbee-cluster-library-specification

最新的zigbee-cluster-library-specification说明文档。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

实现实时数据湖架构:Kafka与Hive集成

![实现实时数据湖架构:Kafka与Hive集成](https://img-blog.csdnimg.cn/img_convert/10eb2e6972b3b6086286fc64c0b3ee41.jpeg) # 1. 实时数据湖架构概述** 实时数据湖是一种现代数据管理架构,它允许企业以低延迟的方式收集、存储和处理大量数据。与传统数据仓库不同,实时数据湖不依赖于预先定义的模式,而是采用灵活的架构,可以处理各种数据类型和格式。这种架构为企业提供了以下优势: - **实时洞察:**实时数据湖允许企业访问最新的数据,从而做出更明智的决策。 - **数据民主化:**实时数据湖使各种利益相关者都可
recommend-type

SQL怎么实现 数据透视表

SQL可以通过使用聚合函数和GROUP BY子句来实现数据透视表。 例如,假设有一个销售记录表,其中包含产品名称、销售日期、销售数量和销售额等信息。要创建一个按照产品名称、销售日期和销售额进行汇总的数据透视表,可以使用以下SQL语句: ``` SELECT ProductName, SaleDate, SUM(SaleQuantity) AS TotalQuantity, SUM(SaleAmount) AS TotalAmount FROM Sales GROUP BY ProductName, SaleDate; ``` 该语句将Sales表按照ProductName和SaleDat
recommend-type

JSBSim Reference Manual

JSBSim参考手册,其中包含JSBSim简介,JSBSim配置文件xml的编写语法,编程手册以及一些应用实例等。其中有部分内容还没有写完,估计有生之年很难看到完整版了,但是内容还是很有参考价值的。