Python编码与字符串操作笔记:UTF-8、保留小数、格式化与正则表达式

需积分: 13 0 下载量 33 浏览量 更新于2024-08-05 收藏 2KB TXT 举报
"本Python笔记主要介绍了编码设置、基本的字符串操作、保留小数的方法、round函数的使用以及re正则表达式模块的应用。" 在Python编程中,正确处理编码是非常重要的。Python默认使用UTF-8编码,允许在字符串、标识符和注释中使用多种语言的字符。为了确保编辑器能正确识别和显示这些字符,你需要确保编辑器设置为UTF-8模式,或者在文件顶部添加特定的编码声明,如`# -*- coding: encoding -*-`,其中`encoding`应替换为实际的编码方式,如`utf-8`或`cp-1252`。 接下来,笔记展示了如何在Python中进行简单的输出,例如"Hello, World!"。字符串是Python的基本数据类型,可以通过引号(单引号或双引号)定义。在示例中,`message`变量存储了一个字符串。 保留小数是数值处理中常见的需求。Python提供了多种方法来实现这一功能。一种是使用字符串格式化,通过`%.nf`来指定保留n位小数,例如`print("%.2f"%x)`。另一种是使用`format`函数,如`print("{:.2f}".format(x))`,同样可以保留指定的小数位数。 `round`函数用于四舍五入到指定的小数位数,如`print(round(x,3))`,这将保留x的小数点后三位。 对于更精确的浮点数处理,Python提供了`decimal`模块。在示例中,`Decimal`类用于创建一个精确的浮点数,然后使用`quantize`方法来指定保留的小数位数,如`a=Decimal(x).quantize(Decimal("0.00000"))`。 在处理小数时,如果不需要四舍五入,可以使用切片操作来截取小数部分,如`a=str(x).split(".")[0]+"."+str(x).split(".")[1][:3]`,这将保留小数点后最多3位。 最后,笔记介绍了Python的`re`模块,用于正则表达式的匹配和查找。在示例中,`re.findall(r"\d{1,}?\.\d{2}",str(a))`查找了包含一位或多位数字,后面跟着一个小数点和两位小数的子序列。 这些基础知识构成了Python编程的基础,理解和掌握它们对于编写高效、可读性强的代码至关重要。在实际开发中,根据需求选择合适的保留小数方法和字符串处理技巧,可以提高代码的灵活性和准确性。同时,正则表达式在文本处理、数据清洗等场景中扮演着重要角色,熟练运用能够极大地提升工作效率。