从https://www.cqwu.edu.cn/channel_24893_03{}.html系列网站中爬取对应新闻的标题，存放在news.txt文件中，使用jieba和WordCloud库输出对应的词云图片。pyhon编写

时间: 2024-12-11 10:29:39 浏览: 7

Linux系统管理期中测试-参考答案.pdf

【知识点详解】 1. **Linux主机名修改**：在Linux系统中，主机名可以通过修改`/etc/hostname`文件来更改。考生需将主机名设置为自己的学号，同时，为了在提示符中显示学号，还需修改`/etc/bashrc`或`/etc/profile`等配置文件，使提示符（PS1）包含学号信息。 2. **查找和打包文件**：使用`find`命令可以按条件查找文件，如`find /etc -size +2k -type f`找出大于2KB的文件。然后使用`tar`命令打包这些文件，如`tar -czvf /home=size2k.tar.gz $(find /etc -size +2k -type f)`。 3. **创建目录和文件以及权限设置**：使用`mkdir`创建目录，`touch`创建文件，`chmod`修改权限。考生需要确保目录具有`rwx`权限（777），文件具有`rwxrw-r--`权限（764）。 4. **创建用户和设置密码**：使用`useradd`命令创建新用户，`passwd`命令设置密码。之后，使用`chown`命令更改文件所有者。 5. **切换用户和修改密码**：使用`su`命令切换用户，`passwd`命令修改密码。 6. **复制和重命名文件**：使用`cp`命令复制文件，`mv`命令重命名文件。例如`cp /root/install.log /tmp/学号/install.log.bak`。 7. **查找文件并输出结果**：使用`find`命令查找符合条件的文件，通过重定向（>`或>>`）将结果输出到指定文件。 8. **打包压缩文件**：使用`tar`命令将多个文件打包压缩成`.tar.gz`格式，如`tar -czvf /home/cqwu.tar.gz /tmp/学号/姓名*`。 9. **创建软链接**：使用`ln -s`创建软链接，例如`ln -s /tmp/学号/姓名 /path/to/link`。 10. **修改目录权限**：使用`chmod`命令修改目录权限，如`chmod 777 /tmp/学号`。 11. **磁盘管理**： - **分区**：在Linux中，使用`fdisk`工具对SCSI硬盘进行分区。创建主分区和逻辑分区，然后使用`w`命令保存分区表。 - **格式化**：使用`mkfs.ext4`命令对分区进行格式化，例如`mkfs.ext4 /dev/sdb1`。 - **挂载**：创建挂载点，如`mkdir /mnt/mydisk1`，然后使用`mount`命令挂载分区，如`mount /dev/sdb1 /mnt/mydisk1`。为了开机自动挂载，需编辑`/etc/fstab`文件添加对应条目。以上是Linux系统管理的一些基础操作，包括系统设置、文件管理、用户和权限控制、磁盘管理等。这些技能是Linux系统管理员必备的基础知识，对于理解Linux系统的工作原理和日常维护至关重要。

首先，让我们分步骤完成这个任务： 1. **网页抓取**: 使用Python的`requests`库获取网站的HTML内容，然后利用`BeautifulSoup`库解析HTML结构，找到新闻标题所在的元素。由于链接格式给出的是模板，你需要替换`{}`部分为实际的页面编号，例如`https://www.cqwu.edu.cn/channel_24893_030.html`。 ```python import requests from bs4 import BeautifulSoup def fetch_news_title(url): response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') title_elements = soup.find_all('h1', class_='news-title') # 假设标题在一个class为"news-title"的h1标签内 titles = [element.text.strip() for element in title_elements] return titles # 替换数字030为你需要爬取的具体页数 titles = fetch_news_title('https://www.cqwu.edu.cn/channel_24893_03{}html'.format('030')) # 请替换这里的数字 ``` 2. **保存新闻标题到文本文件**: 将抓取的标题写入`news.txt`文件。 ```python with open('news.txt', 'w', encoding='utf-8') as f: for title in titles: f.write(title + '\n') ``` 3. **处理文本并生成词云**: 使用`jieba`库对文本进行分词，`wordcloud`库用于创建词云图片。 ```python import jieba from wordcloud import WordCloud # 分词 jieba.setLogLevel(0) # 防止日志干扰 text = '\n'.join(titles) # 生成词云 wordcloud = WordCloud(font_path='simhei.ttf', width=800, height=600, background_color='white').generate(text) # 保存词云图片 wordcloud.to_file('news_wordcloud.png') ``` 记得替换上述代码中的字体路径为你的系统上存在的黑体字体文件（如`simhei.ttf`），以确保词云正常显示汉字。

阅读全文

从https://www.cqwu.edu.cn/channel_24893_03{}.html系列网站中爬取对应新闻的标题，存放在news.txt文件中，使用jieba和WordCloud库输出对应的词云图片。pyhon编写

相关推荐

从https://www.cqwu.edu.cn/channel_24893_03{}.html系列网站中爬取对应新闻的标题，存放在news.txt文件中，使用jieba和WordCloud库输出对应的词云图片。

next_url = 'https://xww.cqwu.edu.cn/'+response.xpath('//a[text()="下一页 > "]/@href').extract_first() TypeError: can only concatenate str (not "NoneType") to str

ModuleNotFoundError: No module named 'cqwu_news'

python爬虫爬取新闻报道

(179979052)基于MATLAB车牌识别系统【带界面GUI】.zip

DG储能选址定容模型matlab 程序采用改进粒子群算法，考虑时序性得到分布式和储能的选址定容模型，程序运行可靠 这段程序是一个改进的粒子群算法，主要用于解决电力系统中的优化问题 下面我将对程序进行详

三保一评关系与区别分析

Day-05 Vue22222222222

多功能知识付费源码下载实现流量互导多渠道变现+搭建教程

住家保姆的工作职责、照顾老人住家保姆服务内容.docx

《高温中暑事件卫生》一级（红色），二级（橙色），三级（黄色），四级（蓝色）.docx

职业中专技工学校专业评估表.docx

统计计算使用R一书的源代码Rcode.zip

YOLO算法-火灾和人员探测数据集-850张图像带标签-人-烟-火.zip

社区居民诊疗健康-JAVA-基于SpringBoot的社区居民诊疗健康管理系统设计与实现（毕业论文）

面部、耳廓损伤损伤程度分级表.docx

java毕设项目之ssm校园美食交流系统+vue(完整前后端+说明文档+mysql+lw).zip

功能完善的小说CMS系统项目全套技术资料.zip

YOLO算法-回收站数据集-501张图像带标签-黑色垃圾箱-绿色垃圾桶-箱子-杯子-老鼠-蓝色垃圾桶.zip

最新推荐

(179979052)基于MATLAB车牌识别系统【带界面GUI】.zip

DG储能选址定容模型matlab 程序采用改进粒子群算法，考虑时序性得到分布式和储能的选址定容模型，程序运行可靠 这段程序是一个改进的粒子群算法，主要用于解决电力系统中的优化问题 下面我将对程序进行详

三保一评关系与区别分析

Day-05 Vue22222222222

多功能知识付费源码下载实现流量互导多渠道变现+搭建教程

Java毕业设计项目：校园二手交易网站开发指南

管理建模和仿真的文件

【MVC标准化：肌电信号处理的终极指南】：提升数据质量的10大关键步骤与工具

能否提供一个在R语言中执行Framingham数据集判别分析的详细和完整的代码示例？

Blaseball Plus插件开发与构建教程

DG储能选址定容模型matlab 程序采用改进粒子群算法，考虑时序性得到分布式和储能的选址定容模型，程序运行可靠这段程序是一个改进的粒子群算法，主要用于解决电力系统中的优化问题下面我将对程序进行详

DG储能选址定容模型matlab 程序采用改进粒子群算法，考虑时序性得到分布式和储能的选址定容模型，程序运行可靠这段程序是一个改进的粒子群算法，主要用于解决电力系统中的优化问题下面我将对程序进行详