Python小白进阶飞桨大神:实战心得与问题解析

0 下载量 177 浏览量 更新于2024-09-01 收藏 366KB PDF 举报
"该资源是一份关于Python学习的心得体会,涵盖了从基础到进阶的应用,包括人像漫画制作、视频内容分析、文本纠错、短语识别、文件操作、数据集创建、情感分析等多个方面。课程通过实际项目,如《青春有你2》的数据处理,帮助学习者巩固和提升Python技能。在实践中遇到的问题,如如何递归遍历目录查找特定文件,以及使用BeautifulSoup进行网页抓取和图片下载等,也在文中得到解答。" 在Python的学习过程中,这位小白通过一系列的项目实践逐渐成长为大神。以下是各学习日的主要知识点详解: Day1: 1. **人像漫画**:涉及到图像处理技术,可能使用了Python的PIL库或者OpenCV库将真人照片转换成动漫风格。 2. **视频内容分析**:可能使用了OpenCV或moviepy等库对视频进行帧解析、内容识别等操作。 3. **文本纠错**:可能涉及自然语言处理(NLP)技术,如Jieba分词库和PaddleNLP中的错误纠正模型。 4. **短语言识别**:与文本分类或序列标注相关,可能使用了PaddlePaddle或TensorFlow等深度学习框架进行训练。 5. **统计文件名**:使用了`os.walk()`遍历目录并统计文件名,了解文件系统操作。 Day2: 1. **网页爬虫**:学习了如何使用BeautifulSoup解析HTML,找到目标元素,抓取图片链接。`div.summary-pic>a`和`div.pic-list>a>img`是CSS选择器,用于定位网页元素。 2. **图片下载**:通过获取到的图片链接,利用requests库下载图片。 Day3: 可能涉及数据分析,从网络上获取并解析《青春有你2》的助力榜单数据,分析数据并揭示排名信息。 Day4: 1. **数据集创建**:自己动手创建数据集,用于模型训练。 2. **PaddleHub**:使用百度的PaddleHub库进行颜值打分,这涉及到图像评估模型的运用。 Day5: 1. **评论调取**:可能使用了网络爬虫技术获取《青春有你2》的评论数据。 2. **词频统计**:使用nltk或jieba等库进行文本处理,统计词频。 3. **词云绘制**:使用wordcloud库生成词云图,可视化高频词汇。 4. **情感分析**:利用PaddleHub的情感分析模型对评论进行情感判断,理解用户情绪。 遇到的问题中,Day1提到了使用`os.walk()`遍历目录查找特定文件,这是Python操作文件和目录的基本技巧,通过递归遍历所有子目录找到匹配文件。 综上,这个学习过程涵盖了Python基础、爬虫、图像处理、NLP、数据分析等多个方面,通过实际项目锻炼了编程能力,同时解决实际问题,是一个全面而实用的学习路线。