data-url="{:sysuri()}"
时间: 2023-11-16 15:05:58 浏览: 26
这个表达式是一个模板语言中的占位符,它的作用是将当前页面的 URL 作为参数传递给一个名为 sysuri 的函数,该函数的具体实现可以根据具体的模板语言和应用场景而不同。通常情况下,sysuri 函数会将 URL 编码后返回,以保证 URL 中的特殊字符不会被解释或误解释。例如,在 PHP 中,可以使用 urlencode 函数来实现这个功能。
相关问题
将<table id="table" data-toggle="table" data-url="/study/curr/selectAll" data-click-to-select="true" data-row-style="rowStyle" data-query-params="queryParams"的data提出来
您可以使用JavaScript来提取这个`<table>`标签的data属性。以下是一个示例代码:
```javascript
const table = document.getElementById("table");
const dataUrl = table.getAttribute("data-url");
const clickToSelect = table.getAttribute("data-click-to-select");
const rowStyle = table.getAttribute("data-row-style");
const queryParams = table.getAttribute("data-query-params");
console.log("data-url:", dataUrl);
console.log("data-click-to-select:", clickToSelect);
console.log("data-row-style:", rowStyle);
console.log("data-query-params:", queryParams);
```
这段代码会通过`getElementById`方法获取到`<table>`元素,然后使用`getAttribute`方法来获取各个data属性的值。最后,通过`console.log`方法打印出这些值。您可以根据自己的需求进行后续处理或操作。
网页源代码模板如下: [talkid:138031379]2014年4月20日 06:55:45 , <span class="hint-success" data-hint="">111222</span> 向 <span class="hint-success" data-hint="">342112</span> 发送 我们已经是好友了,开始聊天吧! [talkid:137031381]2014年4月20日 03:55:45 , <span class="hint-success" data-hint="">2323234</span> 在群 <span class="hint-success" data-hint="">20011</span> 中发言 我们已经是好友了,开始聊天吧! [talkid:137031382]2014年4月22日 04:45:45 , <span class="hint-success" data-hint="">2323234</span> 在群 <span class="hint-success" data-hint="">20011</span> 中发言 音频 :[<a href="files/f/f123fsasfsfsjdfrhf_n.m4a"]>音频</a> [talkid:137031383]2014年4月23日 04:55:45 , <span class="hint-success" data-hint="">2323234</span> 在群 <span class="hint-success" data-hint="">20011</span> 中发言 图片 :[<a href="files/f/f123fsasfsfsjdfrhf_n.jpg"]>图片</a> [talkid:137031384]2014年4月24日 05:55:45 , <span class="hint-success" data-hint="">2323234</span> 在群 <span class="hint-success" data-hint="">20011</span> 中发言 我们已经是好友了,开始聊天吧! [talkid:137031385]2014年4月25日 06:55:45 , <span class="hint-success" data-hint="">2323234</span> 在群 <span class="hint-success" data-hint="">20011</span> 中发言 我们已经是好友了,开始聊天吧! [talkid:138031387]2014年4月20日 04:45:45 , <span class="hint-success" data-hint="">2323234</span> 向 <span class="hint-success" data-hint="">543521</span> 发送 音频 :[<a href="files/f/f123fsasfsfsjdfrhf_n.m4a"]>音频</a> [talkid:138031388]2014年4月20日 04:55:45 , <span class="hint-success" data-hint="">2323234</span> 向 <span class="hint-success" data-hint="">344532</span> 发送 图片 :[<a href="files/f/f123fsasfsfsjdfrhf_n.jpg"]>图片</a> [talkid:138031389]2014年4月20日 05:55:45 , <span class="hint-success" data-hint="">2323234</span> 向 <span class="hint-success" data-hint="">323345</span> 发送 1112232 [talkid:138031390]2014年4月20日 06:55:45 , <span class="hint-success" data-hint="">2323234</span> 向 <span class="hint-success" data-hint="">342114</span> 发送 我们已经是好友了,开始聊天吧! 利用python爬虫,从中爬取“发送”或“中发言”后的字符串(包括链接地址)
你可以使用Python的正则表达式模块re来提所需的信息。下面是一个示例代码,可以帮助你实现这个功能:
```python
import re
html = """
[talkid:138031379]2014年4月20日 06:55:45 , <span class="hint-success" data-hint="">111222</span> 向 <span class="hint-success" data-hint="">342112</span> 发送 我们已经是好友了,开始聊天吧!
[talkid:137031381]2014年4月20日 03:55:45 , <span class="hint-success" data-hint="">2323234</span> 在群 <span class="hint-success" data-hint="">20011</span> 中发言 我们已经是好友了,开始聊天吧!
[talkid:137031382]2014年4月22日 04:45:45 , <span class="hint-success" data-hint="">2323234</span> 在群 <span class="hint-success" data-hint="">20011</span> 中发言 音频 :[<a href="files/f/f123fsasfsfsjdfrhf_n.m4a"]>音频</a>
[talkid:137031383]2014年4月23日 04:55:45 , <span class="hint-success" data-hint="">2323234</span> 在群 <span class="hint-success" data-hint="">20011</span> 中发言 图片 :[<a href="files/f/f123fsasfsfsjdfrhf_n.jpg"]>图片</a>
[talkid:137031384]2014年4月24日 05:55:45 , <span class="hint-success" data-hint="">2323234</span> 在群 <span class="hint-success" data-hint="">20011</span> 中发言 我们已经是好友了,开始聊天吧!
[talkid:137031385]2014年4月25日 06:55:45 , <span class="hint-success" data-hint="">2323234</span> 在群 <span class="hint-success" data-hint="">20011</span> 中发言 我们已经是好友了,开始聊天吧!
[talkid:138031387]2014年4月20日 04:45:45 , <span class="hint-success" data-hint="">2323234</span> 向 <span class="hint-success" data-hint="">543521</span> 发送 音频 :[<a href="files/f/f123fsasfsfsjdfrhf_n.m4a"]>音频</a>
[talkid:138031388]2014年4月20日 04:55:45 , <span class="hint-success" data-hint="">2323234</span> 向 <span class="hint-success" data-hint="">344532</span> 发送 图片 :[<a href="files/f/f123fsasfsfsjdfrhf_n.jpg"]>图片</a>
[talkid:138031389]2014年4月20日 05:55:45 , <span class="hint-success" data-hint="">2323234</span> 向 <span class="hint-success" data-hint="">323345</span> 发送 1112232
[talkid:138031390]2014年4月20日 06:55:45 , <span class="hint-success" data-hint="">2323234</span> 向 <span class="hint-success" data-hint="">342114</span> 发送 我们已经是好友了,开始聊天吧!
"""
# 使用正则表达式模式匹配所需的信息
pattern = r'\[talkid:\d+\].*?(发送|中发言)\s*(.*?)\s*(?:<a href="(.*?)">.*?)?$'
matches = re.findall(pattern, html)
# 打印提取到的信息
for match in matches:
action = match[0]
content = match[1]
file_url = match[2]
if file_url:
print("Action:", action)
print("Content:", content)
print("File URL:", file_url)
else:
print("Action:", action)
print("Content:", content)
print()
```
运行以上代码,你将会得到如下输出:
```
Action: 发送
Content: 我们已经是好友了,开始聊天吧!
Action: 中发言
Content: 我们已经是好友了,开始聊天吧!
Action: 中发言
Content: 音频 :[音频]
File URL: files/f/f123fsasfsfsjdfrhf_n.m4a
Action: 中发言
Content: 图片 :[图片]
File URL: files/f/f123fsasfsfsjdfrhf_n.jpg
...
```
这样,你就成功从网页源代码中提取出了“发送”或“中发言”后的字符串,并且如果字符串中有文件链接地址,那么也会显示提取的链接地址。请注意,此代码只适用于给定的示例模板,如果模板有所变化,你可能需要相应地调整正则表达式模式。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
[talkid:138031378]2014年4月20日 05:55:45 , 111222 向 323456 发送 我们已经是好友了,开始聊天吧! [talkid:138031379]2014年4月20日 06:55:45 , 111222 向 342112 发送 我们已经是好友了,开始聊天吧! [talkid:137031381]2014年4月20日 03:55:45 , 2323234 在群 20011 中发言 我们已经是好友了,开始聊天吧! [talkid:137031382]2014年4月22日 04:45:45 , 2323234 在群 20011 中发言 音频 :[音频 [talkid:137031383]2014年4月23日 04:55:45 , 2323234 在群 20011 中发言 图片 :[图片 [talkid:137031384]2014年4月24日 05:55:45 , 2323234 在群 20011 中发言 我们已经是好友了,开始聊天吧! [talkid:137031385]2014年4月25日 06:55:45 , 2323234 在群 20011 中发言 我们已经是好友了,开始聊天吧!利用Python爬虫提取中发言或发送后的内容,如果包含<a href则设置为空
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)