红楼梦作者辨析:多维度方法揭示文本风格差异
需积分: 45 120 浏览量
更新于2024-08-08
收藏 832KB PDF 举报
本文主要探讨了利用数学方法解析《红楼梦》前八十回与后四十回作者身份的问题。研究采用了三个主要模型来进行分析:人物频率分析、虚词频率分析以及词与词的相关性分析。
1. 模型一:人物频率分析
该模型选取了27个具有代表性的主要人物,通过计算他们在每二十回和四十回组内的出现频率。尽管这种方法减少了运算量,但存在局限性,如可能会忽略关键信息和人物出场时间的变化,导致判断结果的准确性受到挑战。
2. 模型二:虚词频率分析
选取了47个具有普遍性和辨识价值的虚词,分析它们在每四十回组中的出现次数。通过词频统计和聚类分析,发现前八十回和后四十回在虚词使用上存在差异,暗示了作者可能并非同一人。
3. 模型三:词与词的相关性分析
通过比较七类同义异词在不同章节中的分布和相关性,利用卡方检验来验证文本间的相似性。虽然这个模型捕捉到了作者的不同写作风格,但处理过程中对个别字符的识别错误(如标点符号)会影响结果。
4. 辅助方法:标点符号和平均词长分析
方法一借助于SPSS软件,统计标点符号的数量差异,用以判断不同章节的文体差异;方法二则利用平均词长分析,通过词法分析系统确定作者的写作风格特征,但这一过程可能会因标点分割而引入干扰。
本文通过多维度的统计分析,尤其是虚词和词义相关性的方法,为《红楼梦》作者问题提供了有力的证据,表明后四十回与前八十回的写作风格存在显著差异,从而支持了非同一作者的观点。然而,所有模型都面临着数据筛选和处理的局限性,需要进一步的数据支持和完善。参考文献中包含了相关的学术研究,为后续研究提供了理论基础。
2023-05-23 上传
2021-08-18 上传
2022-06-10 上传
2024-10-30 上传
181 浏览量
思索bike
- 粉丝: 38
- 资源: 3974
最新资源
- 高清艺术文字图标资源,PNG和ICO格式免费下载
- mui框架HTML5应用界面组件使用示例教程
- Vue.js开发利器:chrome-vue-devtools插件解析
- 掌握ElectronBrowserJS:打造跨平台电子应用
- 前端导师教程:构建与部署社交证明页面
- Java多线程与线程安全在断点续传中的实现
- 免Root一键卸载安卓预装应用教程
- 易语言实现高级表格滚动条完美控制技巧
- 超声波测距尺的源码实现
- 数据可视化与交互:构建易用的数据界面
- 实现Discourse外聘回复自动标记的简易插件
- 链表的头插法与尾插法实现及长度计算
- Playwright与Typescript及Mocha集成:自动化UI测试实践指南
- 128x128像素线性工具图标下载集合
- 易语言安装包程序增强版:智能导入与重复库过滤
- 利用AJAX与Spotify API在Google地图中探索世界音乐排行榜