$sitemap_index = array( 'https://www.example.com/sitemap1_index.xml.gz', 'https://www.example.com/sitemap2_index.xml.gz' ); // 代理和特定header $proxy = 'http://your-proxy-server.com:8080'; $header = array( 'User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.81 Safari/537.36' );用这段已知代码,如何用PHP的输出2个index.xml.gz各自<loc>标签中的内容,用table表格输出
时间: 2023-06-05 12:08:05 浏览: 123
Django-Blog-Python-Learning:最新版本https://github.comagusmakmunpython.web.id
您好,我可以帮您解答这个问题。
首先,您可以使用 PHP 的 simplexml_load_file() 函数来解析 XML 文件,然后使用 foreach 循环遍历每个 <loc> 标签来输出其中的内容。
代码如下:
```php
<?php
$sitemap_index = array(
'https://www.example.com/sitemap1_index.xml.gz',
'https://www.example.com/sitemap2_index.xml.gz'
);
// 代理和特定 header
$proxy = 'http://your-proxy-server.com:8080';
$header = array(
'User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.81 Safari/537.36'
);
echo '<table border="1">';
echo '<tr><th>Index</th><th>URL</th></tr>';
foreach ($sitemap_index as $index => $sitemap_url) {
// 使用 curl 获取 sitemap 文件内容
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $sitemap_url);
curl_setopt($ch, CURLOPT_PROXY, $proxy);
curl_setopt($ch, CURLOPT_HTTPHEADER, $header);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$xml_content = curl_exec($ch);
curl_close($ch);
// 解析 XML 文件
$xml = simplexml_load_string(gzdecode($xml_content));
foreach ($xml->url as $url) {
echo '<tr><td>' . ($index + 1) . '</td><td>' . $url->loc . '</td></tr>';
}
}
echo '</table>';
?>
```
注:以上代码仅为示例代码,需要您根据实际情况进行修改和调整。
最后,我希望我的回答能够帮到您。
阅读全文