for row in soup.select(".table-row"):这一句应该遍历的是#main > div > div.schedules-view__results > div:nth-child(5);#main > div > div.schedules-view__results > div:nth-child(6)等等我应该如何写呢
时间: 2024-03-27 17:40:31 浏览: 85
如果你想遍历所有船期信息的`table-row`元素,可以先定位到所有船期信息的外层`div`元素,然后遍历其中的每个子元素,判断其是否为`table-row`元素,如果是则提取其中的信息。
例如,可以使用下面的代码遍历所有船期信息:
```
results = soup.select_one("div.schedules-view__results")
for row in results.children:
if row.name == "div" and "table-row" in row.get("class", []):
# 提取船期信息
```
这个代码首先使用`select_one`方法定位到所有船期信息的外层`div`元素,然后遍历该元素的所有子元素,判断其是否为`table-row`元素。如果是,则可以提取其中的信息。注意,这里使用了`get`方法获取`class`属性的值,防止`class`属性不存在时出现异常。
相关问题
for row in soup.select(".table-row"):这一句的元素索引有问题 我该如何找到正确的呢
如果你想找到正确的元素索引,可以先使用浏览器的开发者工具在页面中选中你需要的信息(例如船期信息中的某个字段),然后右键选择Copy -> Copy selector,即可获取到该字段对应的CSS选择器。
例如,如果你想获取船期信息中的`departure_port`字段,可以在页面中选中该字段,然后右键选择Copy -> Copy selector,得到的选择器可能类似于:
```
#app > div > div > div > div > div:nth-child(2) > div > div:nth-child(3) > div > div > div > div:nth-child(1) > span
```
这个选择器使用了多个层级关系和nth-child伪类,比较复杂。但是,使用这个选择器可以定位到该字段对应的元素。
可以根据这种方式,使用开发者工具获取到需要的元素的CSS选择器,然后在代码中使用`select_one`或`select`方法来提取数据。
for row in soup.select(".table-row"): departure_port = soup.select_one("div:contains('Shanghai East Container Terminal')").text.strip() departure_time = soup.select_one("div[data-test='departure-date']").text.strip() arrival_port = soup.select_one("div:contains('PSA Singapore Terminal')").text.strip() arrival_time = soup.select_one("div[data-test='arrival-date']").text.strip() vessel_name = soup.select_one("span:contains('NIMTOFTE MAERSK')").text.strip()这一步是什么意思
这一步的作用是使用CSS选择器来从BeautifulSoup对象`soup`中提取所需的数据,并将其存储在变量中。
首先,`soup.select(".table-row")`使用CSS选择器`.table-row`来匹配所有的class为`table-row`的元素,这些元素包含了船期信息的各个字段。
然后,对于每个匹配到的元素,使用相应的CSS选择器来取出所需的字段值,例如:
- `departure_port = soup.select_one("div:contains('Shanghai East Container Terminal')").text.strip()`: 使用CSS选择器`div:contains('Shanghai East Container Terminal')`匹配到第一个包含"Shanghai East Container Terminal"文本的div元素,并将其文本内容去除空格和换行符后存储在`departure_port`变量中。
- `departure_time = soup.select_one("div[data-test='departure-date']").text.strip()`: 使用CSS选择器`div[data-test='departure-date']`匹配到第一个包含`data-test`属性值为`departure-date`的div元素,并将其文本内容去除空格和换行符后存储在`departure_time`变量中。
- `arrival_port = soup.select_one("div:contains('PSA Singapore Terminal')").text.strip()`: 使用CSS选择器`div:contains('PSA Singapore Terminal')`匹配到第一个包含"PSA Singapore Terminal"文本的div元素,并将其文本内容去除空格和换行符后存储在`arrival_port`变量中。
- `arrival_time = soup.select_one("div[data-test='arrival-date']").text.strip()`: 使用CSS选择器`div[data-test='arrival-date']`匹配到第一个包含`data-test`属性值为`arrival-date`的div元素,并将其文本内容去除空格和换行符后存储在`arrival_time`变量中。
- `vessel_name = soup.select_one("span:contains('NIMTOFTE MAERSK')").text.strip()`: 使用CSS选择器`span:contains('NIMTOFTE MAERSK')`匹配到第一个包含"NIMTOFTE MAERSK"文本的span元素,并将其文本内容去除空格和换行符后存储在`vessel_name`变量中。
最后,将上述变量的值存储在一个字典中,表示一条船期信息。这个字典可以用于后续的数据处理和存储。
阅读全文