Python学习笔记:数据类型、变量与字符串编码解析

需积分: 10 1 下载量 195 浏览量 更新于2024-09-13 收藏 65KB DOCX 举报
在Python学习笔记中,我们首先探讨了数据类型和变量的概念。Python通过`raw_input()`函数获取用户的输入,例如`name=raw_input('Inoutyourname:')`,允许用户交互。在字符串处理方面,单引号`'`用于普通字符串,而三引号`'''`则支持多行字符串,并能保留原始格式,如`print('''aa bb cc''')`,输出结果为三个单独的行。 转义字符在字符串中的使用也很关键,`r`前缀用于取消内部的所有转义字符,如`print('a\n\b')`与`printr'a\nb'`的区别在于前者的换行符会被打印出来,而后者的`\n`会被保留为一个空格。在处理文本时,理解ASCII编码体系(最大整数255)以及其局限性很重要,ASCII仅支持127个字符,而不同国家的编码标准如GB2312、Shift_JIS和Euc-kr导致跨语言文本可能出现问题。为了解决这一问题,Unicode诞生,它提供了统一的编码方案,但英文字符通常只需要1-2字节表示,而汉字可能需要3-6字节,UTF-8编码在此基础上更加高效,根据不同字符的长度分配1-6字节。 UTF-8编码与ASCII的关系是兼容的,许多历史软件可以处理UTF-8,但在内存中,为了统一处理,Python通常使用Unicode编码。编辑器如记事本在读取和保存UTF-8文件时,会进行相应的转换。浏览网页时,服务器生成的Unicode内容会被转换为UTF-8格式传输到浏览器,这也是为何网页源代码中会包含`<meta charset="UTF-8">`声明的原因。 最后,`ord()`和`chr()`函数在Python中扮演着字母和数字之间的桥梁角色。`ord(c)`函数返回字符c对应的Unicode编码值,而`chr(n)`则根据给定的编码值返回相应的字符。这些基本概念在Python编程中是理解和操作字符串和字符编码的基础。学习它们有助于提高代码的可读性和兼容性。