自选数据利用R语言完成基本统计分析:描述性统计分析(集中趋势,离散趋势,分布形状)、频数分析(分类变量:一维)列联分析(二维,三维:交叉频数(频率),边缘频数和频率,边缘频率及频数(和))
时间: 2024-01-22 10:01:41 浏览: 82
频数分布和相关性分析.zip_irr_thumbo6q_和频数分布统计表_相关分析所有变量
好的,假设我们有一个名为 `sales` 的数据集,其中包含了一家公司某个时间段内的销售数据,包括销售额、销售量、商品种类等信息。我们可以使用 R 语言进行基本的统计分析,如下所示:
## 描述性统计分析
### 集中趋势
#### 数值型数据
对于数值型数据,我们可以计算它们的均值、中位数和众数来描述它们的集中趋势。
```R
# 计算销售额的均值、中位数和众数
mean_sales <- mean(sales$sales)
median_sales <- median(sales$sales)
mode_sales <- names(sort(-table(sales$sales)))[1] # 众数
```
#### 分类型数据
对于分类型数据,我们可以计算它们的众数来描述它们的集中趋势。
```R
# 计算商品种类的众数
mode_category <- names(sort(-table(sales$category)))[1] # 众数
```
### 离散趋势
#### 数值型数据
对于数值型数据,我们可以计算它们的方差、标准差、极差和四分位数来描述它们的离散趋势。
```R
# 计算销售额的方差、标准差和极差
var_sales <- var(sales$sales)
sd_sales <- sd(sales$sales)
range_sales <- max(sales$sales) - min(sales$sales)
# 计算销售额的四分位数
quantile_sales <- quantile(sales$sales, probs = c(0.25, 0.5, 0.75))
```
#### 分类型数据
对于分类型数据,我们可以计算它们的频数和频率来描述它们的离散趋势。
```R
# 计算商品种类的频数和频率
freq_category <- table(sales$category)
prop_category <- prop.table(freq_category)
```
### 分布形状
#### 数值型数据
对于数值型数据,我们可以绘制它们的直方图、密度图和箱线图来描述它们的分布形状。
```R
# 绘制销售额的直方图
hist(sales$sales)
# 绘制销售额的密度图
plot(density(sales$sales))
# 绘制销售额的箱线图
boxplot(sales$sales)
```
## 频数分析
### 分类变量:一维
对于分类变量,我们可以使用表格和条形图来进行频数分析。
```R
# 绘制商品种类的频数表和条形图
freq_category <- table(sales$category)
barplot(freq_category, main = "Category Frequency")
```
## 列联分析
### 二维
对于两个分类变量,我们可以使用列联表和堆积条形图来进行列联分析。
```R
# 绘制商品种类和销售量的列联表和堆积条形图
ctab_category_quantity <- table(sales$category, sales$quantity >= 100)
barplot(ctab_category_quantity, beside = TRUE, legend = TRUE, args.legend = list(x = "topright"))
```
### 三维
对于三个分类变量,我们可以使用三维列联表和堆积条形图来进行列联分析。
```R
# 绘制商品种类、销售量和销售额的三维列联表和堆积条形图
ctab_category_quantity_sales <- table(sales$category, sales$quantity >= 100, sales$sales >= 1000)
barplot(ctab_category_quantity_sales, beside = TRUE, legend = TRUE, args.legend = list(x = "topright"), col = c("red", "green"))
```
阅读全文