SAS数据处理:创建大规模数据集的三种方法

3星 · 超过75%的资源 需积分: 40 19 下载量 95 浏览量 更新于2024-07-25 收藏 408KB DOC 举报
"SAS练习题,涉及数据集创建与数组操作" SAS是一种强大的统计分析软件,用于数据管理、分析和预测建模。在提供的练习题中,主要涵盖了使用DATA步、数组语句以及IML过程创建数据集的方法,特别针对大数据量的变量和观测值。以下是这些方法的详细解释: 1. **用DATA步实现** - 第一种方法通过`informat`和`do`循环创建数据集,将变量和观测值逐一定义并输出。`informat`语句定义了变量的输入格式,而`output`语句用于将当前循环内的所有变量输出到数据集中。 - 第二种方法使用`format`语句定义变量的输出格式,然后通过`do`循环生成观测值。在这种情况下,变量并未被赋值,只是创建了空的观测。 2. **用DATA步数组语句实现** - 使用`array`语句可以更高效地处理大量变量。数组变量`t`包含了`x1`至`x10000`的所有变量。`do`循环遍历每个观测值,并通过数组索引来设置变量值。例如,`t{i}=i`表示将第`i`个变量设置为`i`的值。 3. **用IML过程实现** - IML(Integrated Modeling Language)是SAS中的一个模块,专门用于矩阵运算和编程。在这里,首先定义了一个字符向量`x`,包含了所有变量名。然后创建了一个全1矩阵`t`,大小为100行10000列,将矩阵转换为数据集`test1d`,并设置了列名为`x1`至`x10000`。 这些练习题旨在锻炼SAS用户对大量数据处理的能力,特别是理解和应用数组操作,这对于处理金融等领域的大型数据集至关重要。在实际工作中,熟练掌握这些技巧能有效提高数据处理的效率,简化复杂的编程任务。例如,数组操作在处理具有相同结构或模式的多个变量时非常有用,而IML则适合进行高级数学和统计计算。通过这样的练习,用户可以更好地理解和运用SAS的强大功能。
2018-08-27 上传
hcnp练习题 1. (判断)FusionSphere的管理节点全部采用主备部署,提高管理节点的可靠性,同时不需要额外购买数据库和OS的License,除非客户要特殊的要求。 2. (判断)云数据中心就等于虚拟化数据中心。 3. (多选)下列哪些设备可以作为FusionStorage存储池的介质: A. SSD B. SAS C. NL-SAS D. IDE 4. (单选)关于OceanStor DJ,说法不正确的是: A. OceanStor DJ能解决由于数据迅猛增长带来的存储资源紧张问题 B. OceanStor DJ可以根据客户的需求定制资源池 C. OceanStor DJ可以提高运营效率 D. OceanStor DJ让存储管理员随心提供客户所需的服务 5. (判断)虚拟化分为寄居虚拟化、裸金属虚拟化和混合虚拟化等,由于寄居虚拟化简单、易于实现,所以成为了主流的商用虚拟化。 6. (单选)一台物理机共有一路CPU,该CPU是4核8线程,FusionCompute在该主机上创建虚拟机,每个虚拟机分配一个vCPU,请问可以同时有几台这样的虚拟机运行在该物理主机上: A. 4台 B. 8台 C. 32台 D. 条件不足,无法计算 7. (单选)关于FusionCompute的内存QoS,说法不正确的是: A. 通过内存QoS,可以解决内存复用时资源抢占问题 B. 内存QoS技术对物理机一样有效 C. 内存QoS技术主要通过设置内存预留和内存份额实现 D. 设置了内存大小后,虚拟机能够使用的内存不能超过该大小 8. (多选)华为计算虚拟化技术,内存QoS功能包括以下哪些特性: A. 内存上限 B. 内存在线增加 C. 内存预留 D. 内存份额 9. (单选)FusionSphere中存储模型与物理呈现的对应关系错误的是: A. FusionStorage是存储资源 B. OceanStorV3是存储资源 C. LUN是存储设备 D. 共享文件夹是数据存储 10. (单选)请对FusionCompute使用FusionStorage存储池的步骤进行排序: 1.添加存储设备 2.FusionStorage侧关联FusionCompute主机 3.添加数据存储 4.FusionCompute中进行创建卷等操作 5.FusionStorage中创建LUN 6.添加存储资源 A. 6-2-1-5-4 B. 6-2-1-3-4 C. 1-3-6-2-5-4 D. 2-6-5-1-4-3 11. (判断)从Hyper-V上导出的虚拟机VHD格式文件,可以直接导入FusionCompute上进行使用。 12. (多选)FusionCompute中数据存储扩容的方式有: A. 扩容原有存储设备 B. 将新存储设备添加到原有数据存储 C. 扩容原有存储资源 D. 将新的存储资源添加到原有数据存储 13. (多选)推荐的FusionStorage应用场景有: A. FusionCompute虚拟化平台 B. VMware虚拟化平台 C. 公有云场景 D. 数据库及关键应用 14. (判断)FusionStorage读取数据的顺序是:1.内存cache 2.SSD cache 3.磁盘 15. (单选)以下哪种FusionStorage组网方式的网络带宽最高? A. GE组网,使用8网口聚合 B. 万兆组网,使用双网口聚合模式 C. 万兆组网,使用网卡聚合模式,并且存储与业务共用网卡 D. infiniband网络 16. (单选)FusionStorage分离部署架构中,哪两个组件不存在同一服务器上? A. MDC和VBS B. FSA和FSM C. VBS和OSD D. FSA和VBS 17. (多选)以下哪些情形需要网络虚拟化? A. 多个虚拟机共同使用一个物理网口 B. 虚拟机频繁跨物理服务器迁移 C. 南北流量为主传统网络已经满足不了现在的需求 D. 物理机需要与外界通信 19. (判断)SDN的核心技术是转控分离。 20. (单选)VxLAN的部署方式有_______和_________。 A. 单机部署、控制器部署 B. 手动部署、自动部署 C. 物理部署、虚拟部署 D. 静态部署、动态部署 答案: / 1 T / 2 F / 3 ABC / 4 A / 5 F / 6 D / 7 B / 8 CD / 9 D / 10 B / 11 F / 12 AB / 13 ABCD / 14 T / 15 D / 16 C / 17 ABC / 18 T / 19 T / 20 A