周报:PyTorch深度学习实践,CNN与RNN模型探索

需积分: 0 0 下载量 135 浏览量 更新于2024-08-04 收藏 2.19MB DOCX 举报
"20210410周报总结,周宣辰的工作进展,涉及线性模型,CNN,RNN模型以及Pytorch深度学习实践" 这篇周报总结记录了某位名叫周宣辰的同学在2021年4月10日那一周的IT学习与研究进展,主要集中在深度学习领域,特别是模型构建和优化方面。以下是详细的讨论: 1. **小论文进展**: - 阅读文献:这部分工作可能包括对当前研究领域的前沿论文的阅读和理解,这有助于了解最新的理论和技术趋势。 - 做实验:这表明周宣辰正在进行实际的数据实验,可能是验证或测试新的算法或模型。 - 撰写中:可能意味着他正在撰写关于自己研究成果的论文或报告。 2. **本周工作**: - 重新写了简单的线性模型:线性模型是机器学习的基础,重写可能是为了深入理解其原理,或者为了优化实现。 - 复杂一点的CNN模型:CNN(卷积神经网络)在图像处理领域非常常见,用于特征提取和图像分类。复杂一点可能是指增加了网络层次或采用了更复杂的结构如GoogleNet Inception Module。 3. **卷积核选择**: - 讨论了卷积核大小的影响,包括1*1和3*3卷积核。1*1卷积用于信息融合,调整通道数量;3*3卷积核的连续使用可能导致性能下降,可能是因为梯度消失问题。 4. **Residual Networks(残差网络)**: - 提及ResidualBlock的构造,残差网络是为了解决深度网络中的梯度消失问题,通过直接连接输入到输出,确保信号能有效地传播到深层。 5. **优化方法**: - Pytorch中的Momentum动量法:动量法是一种优化策略,通过考虑历史梯度信息来加速学习过程,帮助模型跳出局部最小值和鞍点。 6. **下周计划**: - 继续使用Python通过LeetCode刷题来熟悉语法,这是提升编程技能和理解算法的好方法。 - RNN(循环神经网络)模型改进MNIST手写体识别训练,RNN适合处理序列数据,这里将应用于识别手写数字。 总结,周宣辰的工作涵盖了深度学习的基础模型到高级结构,以及模型优化技术,同时还在持续提高编程能力和理论理解。这些活动展示了深度学习研究者全面的学习路径,从理论研究到实践操作,再到问题解决。