python ：html文本数据存放在路径html_path中，按下列考试要求进行html文本数据处理。考试要求： 1.读取该html文本数据； 2.提取出html中所有的超链接（）的文本和段落（）的文本，所有文本以换行符为间隔，组成一个字符串； 3.按student_answer_path生成文件，并将第2步产生的长字符串写入文件中，编码设置为UTF-8。提示： # 读取和解析html的方式有多种，例如lxml和BeautifulSoup from lxml import etree parser = etree.HTMLParser(encoding="utf-8") # 定义解析器 html = etree.parse(html_path, parser=parser) # 解析路径为html_path的html文本 result = etree.tostring(html, pretty_print=True) # 获取html文本，转换成字符串 from bs4 import BeautifulSoup f = open(html_path,'r',encoding='utf-8') soup = BeautifulSoup(f,'html.parser') # 使用html.parser解析器解析文件f soup.a.get_text() # 获取a中的文本内容，转换成字符串 soup.a.attrs # 获取a所有的属性和属性值，返回一个字典 soup.find_all(name, attrs, recursive, text, **kwargs) # 搜索当前tag的所有tag子节点，并判断是否符合过滤器的条件