红楼梦作者身份:统计分析揭示前后差异
需积分: 45 120 浏览量
更新于2024-07-18
5
收藏 832KB PDF 举报
本文以《红楼梦》的作者解析为核心,运用统计分析方法探讨了该作品前八十回与后四十回的作者归属问题。首先,作者针对问题一,将小说分为每二十回和每四十回的两个阶段,通过MATLAB、SPSS或Python等工具分析人物名称的频率变化。通过对27个主要人物的出现次数进行计算和聚类分析,并借助配对样本\( T \)检验,结果显示人物名称的使用频率并不能揭示出作者的差异。
针对问题二,虚词的使用情况被选为研究对象,选取47个具有代表性的虚词,如“偷懒”、“躲懒”和“托懒”的变体。同样采用频率分析和聚类方法,以及\( T \)检验,发现虚词频率的变化支持了前八十回和后四十回作者不同的观点。
问题三,作者进一步考察了词语之间的语义相关性,选择七类同义词组进行数量和词频分析,通过卡方检验来衡量各组之间的文本相似度。结果显示,第一组和第二组的文本相关性较高,而与第三组(后四十回)的对比则显示出显著差异,从而支持了两部分作者不同的论断。
最后,文章提出两种补充分析方法。方法一是通过标点符号的频率统计,利用SPSS软件进行卡方分析,以识别不同章节样本的差异;方法二是平均词长分析,通过ICTCLAS汉语词法分析系统,观察不同章节的词汇构成和纯文本字符比例,以此作为判断作者风格的依据。
本文通过严谨的统计分析,结合多维度的数据处理和统计测试,有力地论证了《红楼梦》前八十回和后四十回的作者并非同一人。这种方法不仅揭示了文本内部结构的细微差别,也为我们理解文学作品的创作历程提供了新的视角。
2018-06-07 上传
2020-05-28 上传
2023-12-02 上传
2023-03-02 上传
2023-06-12 上传
2024-04-07 上传
2024-01-02 上传
2023-06-28 上传
mytzs123
- 粉丝: 6436
- 资源: 36
最新资源
- 李兴华Java基础教程:从入门到精通
- U盘与硬盘启动安装教程:从菜鸟到专家
- C++面试宝典:动态内存管理与继承解析
- C++ STL源码深度解析:专家级剖析与关键技术
- C/C++调用DOS命令实战指南
- 神经网络补偿的多传感器航迹融合技术
- GIS中的大地坐标系与椭球体解析
- 海思Hi3515 H.264编解码处理器用户手册
- Oracle基础练习题与解答
- 谷歌地球3D建筑筛选新流程详解
- CFO与CIO携手:数据管理与企业增值的战略
- Eclipse IDE基础教程:从入门到精通
- Shell脚本专家宝典:全面学习与资源指南
- Tomcat安装指南:附带JDK配置步骤
- NA3003A电子水准仪数据格式解析与转换研究
- 自动化专业英语词汇精华:必备术语集锦