def parse_title(html): try: root = etree.HTML(html) title = root.xpath('//h3[@class="tb-main-title"]/text()')[0] # 使用XPath定位节点并提取文本 return title except Exception as e: print("解析异常:", e) return None # 测试接口: url = 'https://item.taobao.com/item.htm?id=699089474285&ali_refid=a3_430673_1006:1102522391:N:%2BAkz14GC%2BXi%2Bma9dw7y9M4p5Yhq5iT8I:f9e826228fbc823934848d20e28dff81&ali_trackid=162_f9e826228fbc823934848d20e28dff81&spm=a2e0b.20350158.31919782.5' resp_text = get_with_cookie(url) if resp_text is not None: title = parse_title(resp_text) if title is not None: # 打印商品信息 print(title.strip()) else: print("解析失败") else: print("请求失败")解析异常: module 'xml.etree' has no attribute 'HTML' 解析失败
时间: 2024-01-02 09:02:08 浏览: 250
rails_parse_head:解析head元素(https:developer.mozilla.orgen-USdocsWebHTMLElementhead)
从错误信息来看,Python解释器提示 `module 'xml.etree' has no attribute 'HTML'`,说明 etree 模块中没有名为 HTML 的属性或方法。这是因为在 Python 3.9 及以上版本中,etree 模块不再提供 HTML 解析器,需要使用 lxml 库来代替。可以尝试将代码中的 `etree.HTML` 替换为 `lxml.etree.HTML`,并确保已经安装了 lxml 库。
阅读全文