Error in df_new %>% unnest(评价内容) %>% na.omit() %>% filter(nchar(评价内容) > : 没有"%>%"这个函数
时间: 2024-01-01 11:23:00 浏览: 60
`%>%`是`magrittr`包中的管道运算符,需要先加载该包才能使用。你可以在代码开头加上`library(magrittr)`来加载该包,然后再运行这段代码,例如:
```
library(magrittr)
df_new %>% unnest(评价内容) %>% na.omit() %>% filter(nchar(评价内容) > 0)
```
这样就可以避免出现没有"%>%"这个函数的错误提示了。
相关问题
# 分词,并过滤停用词 stop_words <- stop_words$word comments_words <- comments_df_clean$content %>% unnest_tokens(word, content) %>% anti_join(stop_words),优化代码,使其可以读取字符型数据
可以使用以下代码来进行分词并过滤停用词,同时支持读取字符型数据:
```R
library(tidytext)
library(dplyr)
# 读取停用词表
stop_words <- data.frame(word = stopwords("en"))
# 读取数据并进行清洗
comments_df <- read.csv("comments.csv", stringsAsFactors = FALSE)
comments_df_clean <- comments_df %>%
filter(!is.na(content)) %>%
mutate(content = tolower(content)) %>%
mutate(content = gsub("[^[:alnum:] ]", " ", content)) %>%
mutate(content = gsub("\\s+", " ", content))
# 分词并过滤停用词
comments_words <- comments_df_clean$content %>%
unnest_tokens(word, content) %>%
anti_join(stop_words, by = "word")
```
其中,`read.csv()`函数用于读取CSV文件,`stringsAsFactors = FALSE`参数指定字符型数据不转换为因子型。`filter()`函数用于过滤空值,`tolower()`函数用于将文本转换为小写,`gsub()`函数用于替换不需要的字符,`unnest_tokens()`函数用于将文本分词,`anti_join()`函数用于过滤停用词。
Error in unnest(., 评价内容) : 没有"unnest"这个函数
`unnest()`函数是`tidyr`包中的函数,需要先加载该包才能使用。你可以在代码开头加上`library(tidyr)`来加载该包,然后再运行这段代码,例如:
```
library(tidyr)
df_new %>% unnest(评价内容)
```
这样就可以避免出现没有"unnest"这个函数的错误提示了。
阅读全文