library(topicmodels) library(tidyverse) print(Sys.time()) # load("../community.RData") # d = phy_density$ALGAL_GROUP # d[, 2:ncol(d)] = round(d[, 2:ncol(d)]) # write_csv(d, 'phy_density_Group.csv') source('../code/AIC_model_selection.R') d = read_csv('../data/probs_phy.csv') UID = d$UID # dat = round(d[, -1]/1000) # str(dat) # mean(apply(dat, 2, mean)) # apply(dat, 2, function(x){sum(x > 0)/length(x)}) d = d %>% select(-UID) # d = round(d/1000) seed_number = 10 seeds = 2*seq(seed_number) best_ntopic = repeat_VEM(d, seeds, topic_min = 2, topic_max = 10),其中repeat_VEM函数是如何调用此功能的
时间: 2024-04-08 14:31:45 浏览: 88
CourseProject_GettingCleaningData:此 Repo 包含名为 run_analysis.R、codebook 和 README.md 的项目的代码
根据提供的代码,repeat_VEM函数是通过传递参数d、seeds、topic_min和topic_max来调用的。这意味着repeat_VEM函数将使用数据集d和一系列不同的种子值seeds,以及主题数的最小值topic_min和最大值topic_max来执行主题建模过程。
具体来说,repeat_VEM函数会在给定的主题数范围内,使用每个种子值运行主题建模算法多次,并根据某种评估指标(例如AIC或BIC)选择最佳的主题数。该函数将返回一个表示最佳主题数的结果。
需要注意的是,在给定的代码片段中,并没有提供repeat_VEM函数的具体实现细节。如果您想了解repeat_VEM函数的具体实现,请查看AIC_model_selection.R文件中相关部分的代码。
阅读全文