python数据清洗txt
时间: 2023-09-15 09:15:28 浏览: 141
可以使用Python进行数据清洗,根据提供的引用内容,有两种处理方法。
方法一是使用原生Python进行处理。首先,可以使用read_file函数读取txt文件,并将数据存储在列表中。然后,使用一个新的列表new_ss来存储去重后的数据,通过判断数据是否在new_ss中进行去重。最后,将去重后的数据写入新的文件newfile.txt中。这样就完成了数据清洗的过程。
方法二是使用pandas库进行处理。首先,使用read_csv或者read_table函数读取txt文件,并进行格式化处理,去除行前和行末的空格。然后,使用split函数对数据进行分割,将每行数据分割为单个元素。最后,将转换后的数据存储在DataFrame类型中,可以方便地进行后续处理。
这两种方法都可以实现对非格式化的txt文件进行数据清洗,选择哪种方法可以根据具体情况和个人喜好进行选择。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* [Python数据清洗:从文件读取数据行并去重](https://blog.csdn.net/zhangphil/article/details/89436657)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"]
- *2* *3* [数据清洗,Python读取txt数据,txt数据分隔符处理](https://blog.csdn.net/eyexin2018/article/details/123323703)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]
阅读全文