红楼梦作者身份:统计分析揭示前后差异
需积分: 45 125 浏览量
更新于2024-07-17
6
收藏 832KB PDF 举报
本文以《红楼梦》的作者解析为核心,运用统计分析方法探讨了该作品前八十回与后四十回的作者归属问题。首先,作者针对问题一,将小说分为每二十回和每四十回的两个阶段,通过MATLAB、SPSS或Python等工具分析人物名称的频率变化。通过对27个主要人物的出现次数进行计算和聚类分析,并借助配对样本\( T \)检验,结果显示人物名称的使用频率并不能揭示出作者的差异。
针对问题二,虚词的使用情况被选为研究对象,选取47个具有代表性的虚词,如“偷懒”、“躲懒”和“托懒”的变体。同样采用频率分析和聚类方法,以及\( T \)检验,发现虚词频率的变化支持了前八十回和后四十回作者不同的观点。
问题三,作者进一步考察了词语之间的语义相关性,选择七类同义词组进行数量和词频分析,通过卡方检验来衡量各组之间的文本相似度。结果显示,第一组和第二组的文本相关性较高,而与第三组(后四十回)的对比则显示出显著差异,从而支持了两部分作者不同的论断。
最后,文章提出两种补充分析方法。方法一是通过标点符号的频率统计,利用SPSS软件进行卡方分析,以识别不同章节样本的差异;方法二是平均词长分析,通过ICTCLAS汉语词法分析系统,观察不同章节的词汇构成和纯文本字符比例,以此作为判断作者风格的依据。
本文通过严谨的统计分析,结合多维度的数据处理和统计测试,有力地论证了《红楼梦》前八十回和后四十回的作者并非同一人。这种方法不仅揭示了文本内部结构的细微差别,也为我们理解文学作品的创作历程提供了新的视角。
823 浏览量
249 浏览量
107 浏览量
2024-11-03 上传
117 浏览量
343 浏览量
2024-11-03 上传
591 浏览量

mytzs123
- 粉丝: 6893

最新资源
- Haroopad Linux版发布:跨平台离线Markdown编辑器
- 离线安装Kubernetes 1.24.1环境教程
- Delphi7图书管理系统源码详解与应用
- NEC WriteEZ3_78K0 FLASH编程器GUI使用教程
- PHPWord库:轻松处理Word文档内容
- C#语言中的元启发式算法探究
- 深入分析VNC源码与协议细节
- Android NumberPicker实现城市与生日选择功能
- PHPUnit测试用例展示PHP操作Excel库功能
- Java项目实战:demoproject2技术解析
- LabVIEW中传统与小波去噪算法性能对比研究
- VC字符转换为十进制与十六进制教程
- Android面试题整理:从朋友处收集的精选题目
- QT编程实践:图书管理系统开发教程
- A星算法在Winform中的自动寻径功能演示
- 清华版数据结构教程精要讲义