Stata统计描述入门：计算身高数据的均数与分布

63 浏览量更新于2024-08-04 收藏 670KB DOC 举报

"Stata基本操作和数据分析入门：第二讲统计描述入门" 在本教程中，我们将深入探讨如何使用Stata软件进行基本的数据分析，特别是统计描述。统计描述是理解数据集的关键步骤，它包括计算一系列中心趋势度量（如均数、中位数）、分散度量（如标准差）以及分布特征（如百分位数和频数表）。以下是如何在Stata中执行这些操作的详细介绍：首先，让我们导入给定的身高数据。在Stata中，可以使用`import delimited`或`import excel`命令来导入数据。假设数据已存储在一个名为"height_data.csv"的CSV文件中，可以使用以下命令： ```stata import delimited "path/to/height_data.csv", clear ``` 导入数据后，Stata会显示一个数据视图，其中包含所有变量和观测值。在这个例子中，我们只有一个变量“height”，表示19岁男性的身高。接下来，计算均数和标准差。在Stata中，可以使用`mean`和`sd`命令： ```stata mean height sd height ``` 这将分别显示身高的平均值（均数）和标准差。要计算中位数，可以使用`median`命令： ```stata median height ``` 对于百分位数，Stata提供了`quantile`命令。例如，要计算第25th和第75th百分位数（即四分位数Q1和Q3），输入： ```stata quantile height, p(25) p(75) ``` 生成频数表可以使用`tabstat`命令。例如，我们可以按每5cm的身高间隔创建频数表： ```stata tabstat height, by(ceil(height/5)) format(%4.0f) stat(count) ``` 这将按5cm的区间对身高进行分组，并显示每个区间的观察次数。此外，还可以使用图形来可视化数据分布。例如，使用`histogram`命令创建身高分布的直方图： ```stata histogram height, frequency binwidth(2) ``` 这将创建一个直方图，每个柱子代表2cm的身高区间，频率表示该区间的观察数。通过这些基础的统计描述，我们可以对数据有初步的了解，为进一步的数据分析打下基础。在实际应用中，可能还需要考虑其他统计量，如变异系数、四分位距等，以更全面地了解数据的特性和分布情况。Stata的强大在于其丰富的统计功能和易用的命令，使得数据处理和分析变得更加高效。

Stata 软件基本操作和数据分析入门

第二讲统计描述入门

赵耐青

一、调查某市 1998 年 110 名 19 岁男性青年的身高（cm）资料如下，计算均数、标准

差、中位数、百分位数和频数表。

173.1

167.8

173.9

176.9

173.8

171.5

175.1

175.2

176.7

174.5

169.2

174.7

185.4

175.8

173.5

175.9

173.2

174.8

177.2

171.9

166.0

177.3

175.2

179.8

175.7

180.8

171.4

178.9

172.6

166.9

170.8

168.7

175.0

183.7

171.6

172.9

173.6

177.7

172.4

181.2

178.1

173.3

177.5

173.0

174.3

174.5

172.5

171.3

174.0

177.9

170.7

175.2

178.5

177.6

183.3

173.1

170.9

180.5

176.8

179.6

180.6

176.6

174.3

168.7

175.2

179.5

172.5

173.0

174.2

169.5

177.0

183.6

170.3

178.8

181.1

182.9

177.8

164.1

169.1

176.3

169.4

171.1

172.9

177.0

179.8

178.2

174.4

169.2

176.4

178.3

165.0

175.8

181.0

177.6

177.4

178.7

175.1

181.8

171.3

174.8

181.7

177.3

178.5

179.3

177.0

175.8

181.8

177.5

180.2

Stata 数据结构

173.1

169.2

171.9

166.9

181.2

177.9

179.6

169.5

176.3

178.3

174.8

167.8

174.7

166

170.8

178.1

170.7

180.6

177

169.4

165

下载后可阅读完整内容，剩余9页未读，立即下载

matlab大师

粉丝: 2842

Stata统计描述入门：计算身高数据的均数与分布

Stata基本操作和数据分析入门：第一讲 Stata操作入门.doc

Stata基本操作和数据分析入门：第6讲 线性相关和回归.doc

Stata基本操作和数据分析入门：第三讲 概率分布和抽样分布.doc

Stata基本操作和数据分析入门：第四讲 两组计量资料平均水平的统计检验.doc

java计算器源码.zip

FRP Manager-V1.19.2

基于优化EKF的PMSM无位置传感器矢量控制研究_崔鹏龙.pdf

旧物置换网站(基于springboot,mysql,java).zip

上位机开发，对桥梁、环境等传感器传输的数据进行采集并入库，以便用于系统平台对数据进行处理分析(毕设&课设&实训&大作业&竞赛&项目)

质子号.zip

最新资源

Stata基本操作和数据分析入门：第6讲线性相关和回归.doc

Stata基本操作和数据分析入门：第三讲概率分布和抽样分布.doc

Stata基本操作和数据分析入门：第四讲两组计量资料平均水平的统计检验.doc