"R语言数据处理与字符串操作之因子、日期时间详解"

需积分: 0 0 下载量 63 浏览量 更新于2023-12-21 收藏 654KB PDF 举报
因子字符串日期时间1. 创建与使用因子 2. 有用函数 1. 字符串的长度(包含字符个数) 2. 字符串合并 3. 字符串拆分 4. 字符串格式化输出;R 语言编程:基于 tidyverse第 05 讲数据结构 III: 因子, 字符串, 日期时间张敬信2022 年 2 月 17 日哈尔滨商业大学1 六. 因子(factor) • 数据(变量)可划分为:定量数据(数值型)、定性数据(分类型),定性数据又分为名义型(无好坏顺序之分,如性别)、有序型(有好坏顺序之分,如疗效)。 • R 提供了因子这一数据结构(容器),专门用来存放名义型和有序型的分类变量。因子本质上是一个带有水平(level)属性的整数向量,其中 “水平” 是指事前确定可能取值的有限集合。例如,性别有两个水平:男、女。 • 直接用字符向量也可以表示分类变量,但它只有字母顺序,不能规定想要的顺序,也不能表达有序分类变量。所以,有必要把字符型的分类变量转化为因子型,这更便于对其做后续描述汇总、可视化、建模等。 1. 创建与使用因子 • factor(x, levels, labels, ordered, ...): 将向量 x 创建为因子,levels 与数据中的值是一致的,若不指定则因子水平默认按字母顺序;labels 是你输出因子水平时,想要显示的标签值。 2. 有用函数 在 R 语言中,有一些有用的函数可以用于处理字符串数据的操作,包括: 1. 字符串的长度(包含字符个数) 2. 字符串合并 3. 字符串拆分 4. 字符串格式化输出。 在本次课程中,我们将通过 tidyverse 包来学习 R 语言中的因子、字符串和日期时间的相关操作。 张敬信教授将在 2022 年 2 月 17 日带领我们一起学习哈尔滨商业大学的相关课程内容。在这节课上,我们将学习如何在 R 语言中创建和使用因子,了解因子的相关函数和操作。同时,我们还会学习到如何使用字符串的长度、合并、拆分和格式化输出等操作。 总而言之,本次课程将帮助我们更深入地了解 R 语言中因子、字符串和日期时间的相关知识,并且通过实际操作和案例学习,提高我们在数据结构和数据处理方面的能力。