def convert_masscan_report(xml_path, xls_path): DOMTree = xml.dom.minidom.parse(xml_path) data = DOMTree.documentElement nodelist = data.getElementsByTagName('host') ip_info = {} for node in nodelist: scan_endtime = node.getAttribute('endtime') scan_endtime = time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(int(scan_endtime))) address_node = node.getElementsByTagName('address') addrtype = address_node[0].getAttribute('addrtype') addr = address_node[0].getAttribute('addr') port_node = node.getElementsByTagName('port') ip_prefix = addr.split(".")[0] + "." + addr.split(".")[1] + "." + addr.split(".")[2] if ip_prefix not in ip_info: ip_info[ip_prefix] = {} for port in port_node: if addr in ip_info[ip_prefix]: ip_info[ip_prefix][addr][1] = ip_info[ip_prefix][addr][1] + "," + portid continue protocol = port.getAttribute('protocol') portid = port.getAttribute('portid') state_element = port.getElementsByTagName('state') state = state_element[0].getAttribute('state') reason = state_element[0].getAttribute('reason') reason_ttl = state_element[0].getAttribute('reason_ttl') print('[+] | %s | %s | %s | %s | %s | %s | %s | %s |' % ( addr, portid, state, protocol, addrtype, reason, reason_ttl, scan_endtime)) scan_info = [addr, portid, state, protocol, addrtype, reason, reason_ttl, scan_endtime] ip_info[ip_prefix][addr] = scan_info workbook = xlsxwriter.Workbook(xls_path) for sheet_name, sheet_value in ip_info.items(): worksheet = workbook.add_worksheet(sheet_name) worksheet.autofilter("A1:H1") # 设置过滤 worksheet.freeze_panes(1, 0) # 冻结窗格 worksheet.lastrow = 0 summary_header = ["addr", "port", "state", "protocol", "addrtype", "reason", "reason_ttl", "scan_endtime"] for idx, item in enumerate(summary_header): worksheet.write(0, idx, item, workbook.add_format({"bold": True})) worksheet.lastrow += 1 for addr, addr_info in sheet_value.items(): for i in range(0, len(addr_info)): worksheet.write(worksheet.lastrow, i, addr_info[i]) worksheet.lastrow += 1 workbook.close()

时间: 2024-02-29 17:54:57 浏览: 103

RAR

xml.rar_java dom4j jar_pbbp1ij6.xml

标题中的“xml.rar_java dom4j jar_pbbp1ij6.xml”暗示了这是一个关于Java编程，使用DOM4J库处理XML文件的示例。DOM4J是一个强大的Java库，用于处理XML文档，包括解析、创建、修改和查询XML内容。在描述中提到，“通过dom4j-1.6.1.jar组件实现一般的XML创建与读取，基础代码简单不复杂”，这表明提供的压缩包可能包含了一个简单的Java项目，展示了如何使用DOM4J进行XML操作。在Java中，DOM4J是一个流行的API，它提供了一种灵活的方式来处理XML文档，包括读取、创建、更新和删除XML元素。这个库支持XPath表达式，使得定位XML节点变得容易。DOM4J的主要优势在于它的易用性，即使对于初学者来说，也能快速上手。以下是一些关于使用DOM4J处理XML的基本知识点： 1. **解析XML**：DOM4J提供了`DocumentBuilderFactory`和`DocumentBuilder`来解析XML文件，创建一个`Document`对象，它是整个XML结构的根节点。例如： ```java SAXReader reader = new SAXReader(); Document document = reader.read(new File("path_to_xml_file.xml")); ``` 2. **访问XML元素**：可以通过`Element`接口来访问和操作XML元素。例如，获取根元素： ```java Element rootElement = document.getRootElement(); ``` 3. **遍历XML结构**：可以使用迭代器或者XPath表达式遍历XML树。例如，遍历所有子元素： ```java List<Element> elements = rootElement.elements(); for (Element element : elements) { System.out.println(element.getName()); } ``` 4. **XPath查询**：DOM4J支持XPath表达式，可以方便地定位到特定的XML节点。例如，查找名为"child"的所有元素： ```java XPathFactory factory = XPathFactory.instance(); XPathExpression<Element> xpath = factory.compile("//child"); List<Element> result = xpath.evaluate(document); ``` 5. **创建和修改XML**：DOM4J允许动态创建和修改XML文档。例如，创建一个新的元素并添加到文档中： ```java Element newElement = document.createElement("newChild"); rootElement.add(newElement); ``` 6. **保存XML**：使用`DocumentWriter`或`XMLWriter`将修改后的XML保存到文件中： ```java OutputFormat format = OutputFormat.createPrettyPrint(); XMLWriter writer = new XMLWriter(new FileWriter("output.xml"), format); writer.write(document); writer.close(); ``` 在提供的“pbbp1ij6.xml”文件中，可能会有具体的示例代码展示这些操作。通过运行这个示例，你可以看到如何使用DOM4J进行XML处理，这对于理解和学习XML在Java中的应用非常有帮助。记得解压“xml.rar”，导入“dom4j-1.6.1.jar”库，并根据代码中的指导进行实践。

这段代码的功能是将 Masscan 扫描结果的 XML 格式转换成 Excel 格式。具体实现的过程是：首先解析 XML 文件，然后遍历 XML 中的每个 host 节点，获取其中的 IP 地址，端口号等信息。将 IP 地址按照前三个段进行分组，最终将结果写入到 Excel 文件中，每个 IP 段对应一个 Excel Sheet，每个 Sheet 中包含了该 IP 段下的所有 IP 地址和对应的扫描结果。

阅读全文

相关推荐

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通