利用PHP检查sitemap文件里的各类标签是否正常
时间: 2024-04-20 17:27:29 浏览: 11
可以使用PHP的SimpleXML扩展来检查sitemap文件里的各类标签是否正常。下面是一个示例代码,可以用来检查sitemap文件中的URL标签和lastmod标签是否存在和格式是否正确:
```php
$url = 'http://example.com/sitemap.xml';
$xml = simplexml_load_file($url);
if ($xml === false) {
echo "Unable to load sitemap!\n";
} else {
foreach ($xml->url as $url) {
if (!isset($url->loc) || !filter_var($url->loc, FILTER_VALIDATE_URL)) {
echo "Invalid URL: " . $url->loc . "\n";
}
if (isset($url->lastmod) && !preg_match('/^\d{4}-\d{2}-\d{2}$/', $url->lastmod)) {
echo "Invalid lastmod format: " . $url->lastmod . "\n";
}
}
}
```
这段代码首先使用simplexml_load_file函数加载sitemap.xml文件,然后遍历每个URL标签。对于每个URL标签,它会检查loc标签是否存在且是否为有效的URL,如果不是,则输出错误信息。然后它还会检查lastmod标签是否存在且是否符合YYYY-MM-DD的格式,如果不是,则输出错误信息。
你可以根据实际情况来扩展这段代码,例如检查changefreq标签和priority标签是否存在和格式是否正确等。