python difflib函数
时间: 2023-07-07 12:08:18 浏览: 167
`difflib`是Python标准库提供的用于比较序列间差异的模块。它提供了一些函数和类,比如`SequenceMatcher`类和`ndiff()`函数,用于比较两个序列间的差异。
`SequenceMatcher`类的主要功能是比较两个序列的相似程度,返回一个“相似度得分”。`ndiff()`函数则可以返回两个序列不同之处的详细信息,包括行首标识符、行号和具体差异等。
以下是一个使用`difflib`模块的例子,用于比较两个字符串的相似度:
```python
import difflib
str1 = "hello, world!"
str2 = "hello, python!"
s = difflib.SequenceMatcher(lambda x: x == " ", str1, str2)
print(s.ratio()) # 输出相似度得分
```
输出结果为:
```
0.7142857142857143
```
这里使用了`SequenceMatcher`类的`ratio()`方法来计算相似度得分。`lambda`函数指定了分隔符,这里是空格符。
`ndiff()`函数用于比较两个序列的不同之处:
```python
import difflib
str1 = "hello, world!"
str2 = "hello, python!"
diff = list(difflib.ndiff(str1.splitlines(), str2.splitlines()))
for line in diff:
print(line)
```
输出结果为:
```
hello, world!
- hello, python!
```
这里将字符串按行分割后进行比较,返回两个字符串不同的地方。`-`标识删除的行,`+`标识添加的行,空格表示相同的行。
阅读全文