"R语言数据处理与字符串操作之因子、日期时间详解"

需积分: 0 0 下载量 163 浏览量 更新于2023-12-21 收藏 654KB PDF 举报
因子字符串日期时间1. 创建与使用因子 2. 有用函数 1. 字符串的长度(包含字符个数) 2. 字符串合并 3. 字符串拆分 4. 字符串格式化输出;R 语言编程:基于 tidyverse第 05 讲数据结构 III: 因子, 字符串, 日期时间张敬信2022 年 2 月 17 日哈尔滨商业大学1 六. 因子(factor) • 数据(变量)可划分为:定量数据(数值型)、定性数据(分类型),定性数据又分为名义型(无好坏顺序之分,如性别)、有序型(有好坏顺序之分,如疗效)。 • R 提供了因子这一数据结构(容器),专门用来存放名义型和有序型的分类变量。因子本质上是一个带有水平(level)属性的整数向量,其中 “水平” 是指事前确定可能取值的有限集合。例如,性别有两个水平:男、女。 • 直接用字符向量也可以表示分类变量,但它只有字母顺序,不能规定想要的顺序,也不能表达有序分类变量。所以,有必要把字符型的分类变量转化为因子型,这更便于对其做后续描述汇总、可视化、建模等。 1. 创建与使用因子 • factor(x, levels, labels, ordered, ...): 将向量 x 创建为因子,levels 与数据中的值是一致的,若不指定则因子水平默认按字母顺序;labels 是你输出因子水平时,想要显示的标签值。 2. 有用函数 在 R 语言中,有一些有用的函数可以用于处理字符串数据的操作,包括: 1. 字符串的长度(包含字符个数) 2. 字符串合并 3. 字符串拆分 4. 字符串格式化输出。 在本次课程中,我们将通过 tidyverse 包来学习 R 语言中的因子、字符串和日期时间的相关操作。 张敬信教授将在 2022 年 2 月 17 日带领我们一起学习哈尔滨商业大学的相关课程内容。在这节课上,我们将学习如何在 R 语言中创建和使用因子,了解因子的相关函数和操作。同时,我们还会学习到如何使用字符串的长度、合并、拆分和格式化输出等操作。 总而言之,本次课程将帮助我们更深入地了解 R 语言中因子、字符串和日期时间的相关知识,并且通过实际操作和案例学习,提高我们在数据结构和数据处理方面的能力。

1、在student库中创建数据表t_stu 表的操作,t_stu1 表中的字段为学号、姓名、总分(注意为各字段选定合适的数据类型,下同),设置学号为非空约束,之后用两种方法显示该表的结构信息; 2、将student库中t_stu表更名为t_stu1表,之后用两种方法显示该表的结构信息; 3、在student库中t_stu1表的最后面增加一个字段爱好,之后用两种方法显示该表的结构信息; 4、在student库中t_stu1表的姓名字段后增加一个字段年龄,之后用两种方法显示该表的结构信息; 5、将student库中_stu1表中学号字段数据类型修改为字符型,之后用两种方法显示该表的结构信息; 6、将student库中t_stu1表中总分字段修改为成绩字段(注意给出修改后字段的数据类型),之后用两种方法显示该表的结构信息; 7、将student库中t_stu1表中爱好字段调整至年龄字段后,之后用两种方法显示该表的结构信息; 8、删除student库t_stu1表中爱好字段,之后用两种方法显示该表的结构信息; 9、删除student库中t_stu1表并使用合适命令检查确认; 10、在student库中创建数据表t_stu2表的操作,t_stu1表中的字段为学号、姓名、总分,设置姓名默认值为“Iii”,之后用两种方法显示该表的结构信息; 11在student库中创建数据表t_stu3表的操作,t_stu3表中的字段为学号、姓名、总分,为学号设置唯一约束,之后用两种方法显示该表的结构信息; 12、往t_stu2表中插入单条完整记录:“1401”、“李青”、“420”,之后使用查询语句查看表中记录情况; 13、往t_stu2表中插入单条不完整记录:“1402”、“吴凡”,之后使用查询语句查看表中记录情况;

2023-03-22 上传