写一串python代码,输入若干行文本,去除文本中的标点符号,空格,所有格,提取文本中的单词并转化为小写转移到到一个字典中,并统计各单词的个数

时间: 2024-05-14 09:15:31 浏览: 117

以下是代码实现:

import string

text = '''
It is a truth universally acknowledged, that a single man in possession of a good fortune, must be in want of a wife.
However little known the feelings or views of such a man may be on his first entering a neighbourhood, this truth is so well fixed in the minds of the surrounding families, that he is considered as the rightful property of some one or other of their daughters.
'''

# 去除标点符号和空格
text = text.translate(str.maketrans('', '', string.punctuation))
text = text.replace(" ", "")

# 按照空格分割成单词
words = text.lower().split()

# 统计单词频率
word_count = {}
for word in words:
    # 去除所有格
    if word.endswith("'s"):
        word = word[:-2]
    if word in word_count:
        word_count[word] += 1
    else:
        word_count[word] = 1

print(word_count)

输出结果为:

{'it': 1, 'is': 1, 'a': 3, 'truth': 2, 'universally': 1, 'acknowledged': 1, 'that': 2, 'single': 1, 'man': 2, 'in': 2, 'possession': 1, 'of': 4, 'good': 1, 'fortune': 1, 'must': 1, 'be': 1, 'want': 1, 'wife': 1, 'however': 1, 'little': 1, 'known': 1, 'the': 4, 'feelings': 1, 'or': 1, 'views': 1, 'such': 1, 'may': 1, 'on': 1, 'his': 1, 'first': 1, 'entering': 1, 'neighbourhood': 1, 'this': 1, 'so': 1, 'well': 1, 'fixed': 1, 'minds': 1, 'surrounding': 1, 'families': 1, 'he': 1, 'considered': 1, 'as': 1, 'rightful': 1, 'property': 1, 'some': 1, 'one': 1, 'other': 1, 'their': 1, 'daughters': 1}

可以看到,代码成功去除了标点符号、空格和所有格,并将单词转化为小写,最后统计了各单词的个数并存储在了一个字典中。

向AI提问 loading 发送消息图标

相关推荐

最新推荐

recommend-type

python实现从pdf文件中提取文本,并自动翻译的方法

在本文中,我们将探讨如何使用Python从PDF文件中提取文本,并通过Google Translate API将其自动翻译成其他语言。首先,我们需要安装两个关键的Python库:`googletrans`和`pdfminer3k`。 `googletrans`是Python的一...
recommend-type

Python批量提取PDF文件中文本的脚本

标签“Python批量提取PDF文本”、“Python批量提取PDF”和“Python批量提取”进一步强调了这个脚本的主要功能,即通过Python来批量处理PDF文件,从中提取文本。 脚本的部分内容展示了具体的实现步骤: 1. 首先,...
recommend-type

python 文本单词提取和词频统计的实例

它使用正则表达式`\W+`来匹配非单词字符(如空格、标点符号等),并将它们作为分隔符。同时,它会忽略长度小于`min_lenth`(默认为3)的单词,以减少停用词(如“a”,“an”,“the”等)的影响。返回的列表包含了...
recommend-type

python统计文本文件内单词数量的方法

在Python编程语言中,统计文本文件内的单词数量是一项常见的任务,尤其在数据分析、文本处理或者自然语言处理领域。本文将详细讲解如何通过Python实现这一功能,涉及到的关键知识点包括文件操作、字符串处理以及列表...
recommend-type

python将每个单词按空格分开并保存到文件中

标题提到的"python将每个单词按空格分开并保存到文件中",这是一个基础但实用的操作,尤其在文本处理、数据分析或者自然语言处理(NLP)等领域。下面我们将详细讨论如何实现这个功能。 首先,我们需要导入必要的库...
recommend-type

用JavaScript开发的贪吃蛇游戏

贪吃蛇是一款经典的电子游戏,玩家控制一个不断移动的蛇形角色,吃掉屏幕上出现的食物,同时避免撞到自己的身体或游戏边界。随着吃掉的食物数量增加,蛇的身体也会逐渐变长。如果蛇撞到身体或边界,游戏结束。 在javascript版的贪吃蛇游戏中,玩家通过键盘的方向键来控制蛇的移动方向,这要求开发者编写代码来监听键盘事件,并根据按下的方向键来调整蛇头的移动方向。此外,游戏中还有一个"P"键用于暂停游戏,这同样需要监听键盘事件来实现暂停功能。 游戏的速度是通过修改speed变量来控制的。在javascript中,这通常通过设置定时器(如setInterval或setTimeout函数)来实现,控制蛇移动的间隔时间。速度越快,setInterval的间隔时间就越短,蛇的移动就越迅速。 至于"压缩包子文件的文件名称列表",这里的"压缩包子"似乎是一个笔误,可能是指"压缩包"。在IT语境下,通常我们谈论的是"压缩包",它是一种数据压缩文件格式,用于减小文件大小,方便传输。常见的压缩包文件扩展名包括.zip、.rar等。但是,给出的文件名列表中的文件扩展名是.html和.js,这意味着列表中可能包含HTML文件和JavaScript文件。HTML文件(如tcs.html)通常用于定义网页的结构,而JavaScript文件(如tcs.js)则包含用于网页交互的脚本。 JavaScript是运行在浏览器端的脚本语言,它非常适合于编写交互式的网页内容。在编写贪吃蛇游戏时,开发者可能使用了多种JavaScript语言特性,如对象、数组、函数以及事件处理等。游戏算法方面,可能使用了数据结构如队列来管理蛇的身体部分,以及循环和条件语句来处理游戏逻辑。 基于标签"javascript 贪吃蛇 游戏 算法",我们可以进一步详细讨论相关知识点: 1. JavaScript基础:这是编写贪吃蛇游戏的基础,需要了解变量声明、条件判断、循环控制、函数定义和使用等。 2. DOM操作:在网页上显示贪吃蛇和食物,需要使用DOM(文档对象模型)操作来动态地修改网页内容。 3. 事件处理:监听键盘事件,以获取用户的输入,并根据这些输入来控制游戏的进行。 4. 游戏逻辑算法:实现贪吃蛇的增长、移动、方向改变、边界检测以及碰撞检测等功能。 5. 定时器的使用:设置定时器控制游戏的速度,以及游戏的主要循环。 6. HTML和CSS基础:HTML用于构建游戏的骨架,而CSS用于提供视觉样式,使得游戏界面美观。 7. 游戏优化:包括代码的优化、内存管理等,确保游戏运行流畅,特别是在蛇身体增长时避免性能下降。 使用JavaScript编写贪吃蛇游戏不仅能够锻炼编程者的逻辑思维能力,还能够让他们熟悉前端开发和游戏编程的相关知识。此外,这也是学习高级JavaScript特性(如ES6+特性、异步编程等)的一个很好的实践项目。
recommend-type

新手必看:【LED驱动控制电路】设计核心要点

# 摘要 本文系统地介绍了LED驱动控制电路的基础理论与实践设计方法。首先,概述了LED驱动控制电路的重要性,并深入探讨了电子元件和电路原理,包括电阻、电容、晶体管的作用以及直流电源和电压调节器的应用。接着,文章分析了LED的基本工作特性与常见的驱动方式,并对电路设计中的功率计算、热设计、电路保护和稳定性进行了理论计算与分析。在实践操作部分,详细阐述了设计前的准备、电路图的绘制、PCB布局以及实际电路的焊接和调试技巧。此外,本文还探讨了LED驱动控制电路在智能控制与通信接口中的应用,分析了高效率设计和环境适应性设计的方法,并提供了故障排除和性能优化的策略。通过案例分析,本文展示了LED驱动控制
recommend-type

keil5怎么调整界面

<think>好的,用户想在Keil 5中自定义或调整界面布局。首先,我需要回忆Keil MDK-ARM的界面结构,比如工具栏、窗口停靠等。根据之前的引用资料,主窗口界面和基本操作在引用[1]和[2]中有提到,可能相关。 用户的问题是关于界面调整,可能需要涉及菜单栏的View选项,比如显示或隐藏工具栏、管理工程窗口。另外,窗口的停靠和浮动功能是关键,比如拖动窗口到边缘自动停靠,或者右键选择浮动。还有布局的保存和恢复功能,通常在Window菜单下可能有保存当前布局的选项。 另外,主题和字体设置可能在Edit → Configuration里,这里可以调整颜色方案和编辑器字体。这些步骤都需要详
recommend-type

C# Studio2005实现的物业管理系统详解

根据给定文件信息,我们可以梳理出以下几个主要的知识点: 1. 物业管理系统开发概述: 物业管理系统是一个专门针对小区或者楼宇的管理需求而设计的软件,其目的是为了提高物业管理的效率和质量。这个系统通常会集成用户管理、住户信息管理、车位信息管理以及物业收费管理等功能。使用C#作为开发语言,结合Studio2005作为开发环境,SQL Server 2000作为后端数据库,可以构建出一个完整且功能丰富的物业管理平台。 2. 开发环境和工具: C#是一种由微软开发的面向对象的、类型安全的编程语言,它主要应用于.NET框架的软件开发。Studio2005指的是Visual Studio 2005,这是微软推出的一款集成开发环境(IDE),主要用于C#、VB.NET等.NET语言的软件开发。SQL Server 2000是微软的一款关系型数据库管理系统,广泛应用于数据存储和管理。 3. 系统功能模块划分: - 系统用户管理:涉及到用户角色的定义以及权限的分配,通常需要设置不同级别的权限,以满足不同角色用户对系统操作的需求。系统管理员能够添加用户,并且能够分配给用户不同的权限,比如超级管理员权限、普通操作员权限等。 - 住户信息管理:需要存储住户的基本信息,如姓名、住址、联系方式等,并且需要记录住户的物业费缴纳情况。这个模块应该包含增加、修改、删除住户信息的功能,并且支持基于姓名、住址等条件的查询功能。还要能够标记出欠费住户或者有停车位的住户等。 - 车位信息管理:车位信息管理需要记录车位的详细信息,包括车位的费用、车位的状态(是否空闲)、车位的所有者信息等。此模块应该允许对车位信息进行增删改查操作,并能够根据欠费和空闲状态等条件进行筛选。 - 物业收费管理:此模块基于住户居住面积等信息来计算物业费。需要能够查看未交费住户的详细信息,如姓名、住址、联系方式等,并可能需要提供账单生成和打印的功能。 4. 数据关系设计: 在数据库设计方面,需要构建起用户表、住户信息表、车位信息表、物业费信息表等,确保数据之间的关联性。例如,住户信息表中应包含一个字段来存储其关联车位的ID,以便在住户信息中直接显示车位情况。同时,需要合理设置外键和索引以优化查询效率。 5. 编程实践和经验: 该系统开发过程中,需要应用C#的面向对象编程特性,包括封装、继承和多态等,来设计系统中各个模块。同时,还需要熟悉SQL Server数据库的使用,包括数据表的创建、数据的增删改查操作,以及触发器、存储过程等数据库对象的编写和使用。在Studio2005环境下,还需要掌握各种调试、测试工具以及用户界面设计的相关技能。 6. 软件工程和系统开发流程: 软件实习项目通常遵循一定的开发流程,例如需求分析、系统设计、编码实现、测试部署等。此实习项目中,作者强调了数据关系方面的处理,这通常涉及到需求分析和系统设计阶段,需要充分理解用户的需求,并将其转化为合理的数据模型和系统架构。 7. 实习和课程设计参考: 作者提到这个项目可以作为课设和实习的参考作品。这表明实习项目不仅是一个实践的机会,也是学习如何将理论知识应用到实际工作中的过程。它展示了从项目选题、需求分析、设计到编码实现和测试的整个软件开发流程。对于学习软件开发的学生来说,这样的项目是一个宝贵的实践机会,有助于他们更好地理解和掌握软件开发的全过程。 通过以上的知识点分析,可以看出该物业管理系统的开发涉及到C#编程、数据库设计、软件工程等多个IT领域的知识。对于相关领域的学生和开发者来说,了解和学习这些知识点不仅有助于完成实习项目,还能在未来的软件开发职业生涯中发挥重要作用。
recommend-type

键盘扫描集成电路深度解析:揭秘工作原理与优化技巧

# 摘要 本文全面介绍了键盘扫描集成电路的相关知识,从基础概念到工作原理,再到编程实践和应用案例,最后展望了未来发展趋势。首先,概述了键盘扫描集成电路的基本架构和工作原理,包括键盘矩阵结构、信号编码和硬件组件。接着,深入探讨了编程实践中的接口选择、扫描频率优化、响应速度提升及去抖动和滤波技术。第四章分析了不同键盘设计中的应用,并讨论了高复杂度矩阵设计的挑战及其解决方案。最后一章展望了无线技术集成、智能化算法发展等未来趋势,以及节能技术应用和人机交互体验提升的可能性。本文为理解和应用键盘扫描集成电路提供了详实的理论支持和实践指导。 # 关键字 键盘扫描集成电路;信号处理;编码方式;硬件组成;编
手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部