php批量获取sitemap.xml里面所有<loc>和</loc>之间的url,并加入list
时间: 2024-02-13 17:03:20 浏览: 95
python pandas.DataFrame.loc函数使用详解
可以使用以下PHP代码批量获取`sitemap.xml`文件中所有`<loc>`和`</loc>`之间的URL,并加入到一个数组中:
```php
<?php
$file = 'sitemap.xml';
if (file_exists($file)) {
$xml = simplexml_load_file($file, 'SimpleXMLElement', LIBXML_NOCDATA);
$urls = array();
foreach ($xml->url as $url) {
$urls[] = (string) $url->loc;
}
print_r($urls);
} else {
echo "文件不存在!";
}
?>
```
该代码首先使用`file_exists()`函数判断当前目录下是否存在`sitemap.xml`文件,如果文件存在,则使用`simplexml_load_file()`函数将XML文件加载为SimpleXMLElement对象,并使用`foreach`循环遍历所有的`<url>`标签,将其中的`<loc>`标签中的URL加入到一个数组中,最后使用`print_r()`函数输出数组内容。
需要注意的是,`<loc>`标签中的URL可能包含特殊字符,比如空格、&等,需要使用`urlencode()`函数将其进行编码。如果需要将URL解码,可以使用`urldecode()`函数。
阅读全文