tf7 = tf_vectorizer.transform(data7.content_cutted) topics1 = lda.transform(tf1)报错Traceback (most recent call last): File "D:\python\lda\dateyh.py", line 127, in <module> topics1 = lda.transform(tf1) File "C:\Users\DELL\lib\site-packages\sklearn\decomposition\_lda.py", line 708, in transform X = self._check_non_neg_array( File "C:\Users\DELL\lib\site-packages\sklearn\decomposition\_lda.py", line 540, in _check_non_neg_array X = self._validate_data(X, reset=reset_n_features, accept_sparse="csr") File "C:\Users\DELL\lib\site-packages\sklearn\base.py", line 566, in _validate_data X = check_array(X, **check_params) File "C:\Users\DELL\lib\site-packages\sklearn\utils\validation.py", line 805, in check_array raise ValueError( ValueError: Found array with 0 sample(s) (shape=(0, 500)) while a minimum of 1 is required.
时间: 2023-07-21 20:53:29 浏览: 86
EurekaLog_7.5.0.0_Enterprise
5星 · 资源好评率100%
这个报错是因为你传递的 `tf1` 变量是一个形状为 `(0, 500)` 的空数组,而 LDA 模型需要至少一个样本才能进行拟合和预测。可能是因为你的 `data1` 数据中没有任何文本数据,或者在对 `data1` 进行文本预处理时出现了错误,导致 `tf1` 变量为空数组。你可以检查一下你的数据预处理步骤,确保它能够正确地生成非空的文本特征表示。
阅读全文