给出上述代码所使用的每个数据结构的名称、标识符以及它们之中每个数据项、记录、文卷和系的标识、定义、长度及它们之间的层次的或表格的相互关系。def askURL(url): head = { #模拟浏览器头部信息,向豆瓣服务器发送消息 "User-Agent": "Mozilla / 5.0(Windows NT 10.0; Win64; x64) AppleWebKit / 537.36(KHTML, like Gecko) Chrome / 80.0.3987.122 Safari / 537.36" } #用户代理,表示告诉豆瓣服务器,我们是什么类型的机器、浏览器(本质上是告诉浏览器,我们可以接收什么水平的文件内容) request = urllib.request.Request(url,headers=head) html = "" try: response = urllib.request.urlopen(request) html = response.read().decode("utf-8") except urllib.error.URLError as e: if hasattr(e,"code"): print(e.code) if hasattr(e,"reason"): print(e.reason) return html #保存数据 def saveData(datalist,savepath): print("save....") book = xlwt.Workbook(encoding="utf-8",style_compression=0) #创建workbook对象 sheet = book.add_sheet('豆瓣电影Top250',cell_overwrite_ok=True) #创建工作表 col = ("电影详情链接","图片链接","影片中文名","影片外国名","评分","评价数","概况","相关信息") for i in range(0,8): sheet.write(0,i,col[i]) #列名 for i in range(0,250): print("第%d条" %(i+1)) data = datalist[i] for j in range(0,8): sheet.write(i+1,j,data[j]) #数据 book.save(savepath) #保存 def saveDataDB(datalist,dbpath): init_db(dbpath) conn = sqlite3.connect(dbpath) cur = conn.cursor() for data in datalist: for index in range(len(data)): if index == 4 or index == 5: continue data[index] = '"'+data[index]+'"' sql = ''' insert into movie250 ( info_link,pic_link,cname,ename,score,rated,instroduction,info) values(%s)'''%",".join(data) # print(sql) cur.execute(sql) conn.commit() cur.close() conn.close() def init_db(dbpath): sql = ''' create table movie250 ( id integer primary key autoincrement, info_link text, pic_link text, cname varchar, ename varchar, score numeric , rated numeric , instroduction text, info text ) ''' #创建数据表 conn = sqlite3.connect(dbpath) cursor = conn.cursor() cursor.execute(sql) conn.commit() conn.close()
时间: 2024-04-08 09:32:36 浏览: 126
微信小程序页面跳转功能之从列表的item项跳转到下一个页面的方法
根据您提供的代码片段,以下是代码中使用的数据结构的名称、标识符以及它们之间的关系:
1. `head`:字典类型的变量,表示模拟浏览器头部信息,用于向豆瓣服务器发送消息。
2. `request`:`urllib.request.Request`对象,用于发送HTTP请求并包含URL和头部信息。
3. `html`:字符串类型的变量,用于存储从豆瓣服务器返回的HTML内容。
4. `response`:`urllib.request.urlopen`函数返回的响应对象,包含从服务器接收到的HTTP响应。
5. `datalist`:列表类型的变量,存储从豆瓣电影Top250页面解析得到的数据项。
6. `savepath`:字符串类型的变量,表示保存数据文件的路径。
7. `book`:`xlwt.Workbook`对象,表示一个Excel工作簿。
8. `sheet`:`book.add_sheet`函数返回的工作表对象,表示Excel工作簿中的一个工作表。
9. `col`:元组类型的变量,包含Excel表格中的列名。
10. `data`:列表类型的变量,表示每一条电影数据。
11. `dbpath`:字符串类型的变量,表示SQLite数据库文件的路径。
可以看出,主要使用了字典、字符串、列表、Excel工作簿、工作表和SQLite数据库等数据结构。这些数据结构之间的关系如下:
1. `head`用于构建`request`对象,并作为其头部信息。
2. `request`对象被用于发送HTTP请求,并接收到的响应存储在`html`字符串中。
3. `datalist`列表存储从豆瓣电影Top250页面解析得到的电影数据项。
4. `saveData`函数使用`datalist`和`savepath`参数,将数据保存到Excel表格中。
5. `saveDataDB`函数使用`datalist`和`dbpath`参数,将数据保存到SQLite数据库中。
6. `init_db`函数用于初始化SQLite数据库,创建名为`movie250`的数据表。
请注意,这只是根据代码片段推测的数据结构和关系,并不代表完整的系统实现。如果您有更多特定的代码或系统信息,我可以为您提供更准确的分析。
阅读全文