没有合适的资源?快使用搜索试试~ 我知道了~
基于类别级置信度的3D半监督学习方法
{zhiminc,bli4}@clemson.edu, ljing@gradcenter.cuny.edu, lyang1@ccny.cuny.edu,6330基于类别级置信度的3D半监督学习0Zhimin Chen 1 , Longlong Jing 2 , Liang Yang 2 , Yingwei Li 3 , and Bing Li 101 Clemson大学 2 纽约市立大学3 约翰霍普金斯大学0yingwei.li@jhu.edu0摘要0最近的最先进方法FlexMatch首次证明了正确估计学习状态对于半监督学习(SSL)至关重要。然而,FlexMatch提出的估计方法没有考虑到数据不平衡,而这在3D半监督学习中是常见情况。为了解决这个问题,我们实际证明了无标签数据的类别级置信度可以代表3D不平衡数据集中的学习状态。基于这一发现,我们提出了一种新的基于类别级置信度的3D半监督学习方法。首先,提出了一种动态阈值策略,以利用更多的无标签数据,特别是对于学习状态较低的类别。然后,设计了一种重新采样策略,避免对学习状态较高的类别产生偏见,动态改变每个类别的采样概率。为了展示我们的方法在3D半监督学习任务中的有效性,我们在3D半监督分类和检测任务上进行了大量实验。我们的方法在所有数据集的3D半监督分类和检测任务中明显优于最先进的对手。01. 引言0由于3D点云数据的收集和标注费时费力,近年来3D半监督学习(SSL)引起了越来越多的关注,并显示出在利用无标签数据方面的优势[46, 31, 4, 25,43]。大多数现有的半监督学习方法,如伪标签法[12]和FixMatch[25],采用伪标签策略,即使用网络对无标签数据的高置信度预测作为标签来进一步优化网络。基于伪标签策略的方法是0广泛应用并在许多不同任务中取得了显著的性能提升[46,31, 4,25]。然而,伪标签法的一个不可忽视的缺点是它依赖于手动预定义的固定阈值来选择高质量的伪标签。对于来自无标签数据的每个数据,无论其类别如何,只有当其置信度高于此固定阈值时,才会用于训练;否则,该数据将被忽略。在3D任务中,常见做法是使用一个非常高的阈值(0.9)[31,4]来保留高质量的伪标签。这个固定阈值忽视了不同类别之间的学习状态差异,因此导致大量的无标签数据未被使用,这损害了模型的性能。0为了解决这个问题,一种直观的方法是估计每个类别的学习状态,并相应地设置动态阈值。然而,关键挑战在于如何估计学习状态。最近的SOTA方法FlexMatch[43]利用课程学习方法来估计每个类别的学习状态并灵活调整阈值。然而,FlexMatch没有很好地定义术语'学习状态'。在这项工作中,我们将'学习状态'定义为模型对某个类别的学习程度以及在测试准确性中的反映。我们利用每个类别的测试准确性来表示学习状态。此外,在FlexMatch中,只考虑了学习困难度来估计学习状态,但没有考虑到数据不平衡的情况。我们发现学习困难度和数据不平衡都会影响网络的学习状态。例如,网络在高学习困难度但是多数类别和低学习困难度但是少数类别上可能具有类似的性能。01. We clarify the definition of learning status and prac-tically demonstrate that the class-level confidence canrepresent the learning status of each class. Based onthis finding, we propose a learning status estimationmethod that works well in the imbalanced 3D dataset.6340(a)0(b)0图1:在ModelNet40数据集上使用10%标记数据训练的FixMatch结果分析。(a)选定的伪标签与未标记数据的比例。(b)测试准确率和未标记数据的类别级置信度。很明显可以观察到:(1)只有很小比例的未标记数据在高阈值设置下进行训练。(2)每个类别的学习困难程度存在很大差异。一些少数类别的准确率比多数类别高。(3)类别级置信度与每个类别的测试准确率存在很高的相关性。01.我们明确了学习状态的定义,并实际证明了类别级置信度可以表示每个类别的学习状态。基于这一发现,我们提出了一种在不平衡的3D数据集中表现良好的学习状态估计方法。0在训练过程中,只有少量数据的预测置信度大于固定的高阈值。然而,我们发现通过动态阈值提高选定的伪标签数量不能消除由于数据不平衡和学习困难差异引起的学习状态差异。这使得网络偏向于高学习状态的类别,从而导致过拟合。为了避免这个问题,我们进一步提出了一种新颖的重新采样策略,根据学习状态动态采样数据。具体而言,我们的重新采样策略增加了属于低学习状态类别的实例的采样概率,并降低了高学习状态类别的采样概率。通过动态阈值和重新采样,我们的方法可以更有效地利用未标记的数据并平衡每个类别的学习状态。我们的方法的目标是估计每个类别的学习状态,并进一步平衡和改善学习状态。与其他3D半监督学习方法相比,我们的方法估计每个类别的学习状态,动态调整阈值,并根据学习状态重新采样数据。我们的方法可以轻松应用于不同的半监督任务,以改善即使在不平衡数据集中也能提高性能。为了证明所提方法的普适性,我们在两个不同的任务上评估了我们的方法,包括SSL 3D物体识别和SSL3D物体检测任务。我们的方法在性能上大大优于现有方法。我们的主要贡献总结如下:02.首先,我们根据学习状态将学习困难和不平衡的数据问题结合在一起。我们提出了一种新颖的3D半监督学习方法,根据每个类别的学习状态动态调整阈值并重新采样数据,从而平衡和改善学习状态,同时解决学习困难和不平衡数据问题的差异性。03.我们提出的方法在半监督3D目标检测和分类方法方面的性能优于现有方法。02. 相关工作0半监督学习:近年来,半监督学习方法取得了显著进展[2, 3,6, 12, 16, 28, 17,38]。许多现有的半监督学习方法利用伪标签[12]来最小化熵。3. MethodThe overview of our proposed method is shown in Fig 2.It contains three main parts: (1) learning status estimation,which is obtained by the class-level confidence based onthe model predictions on the unlabeled data, (2) dynamicthresholding based on the learning status of each lass, and(3) dynamically re-sampling for each class based on thelearning status. The formulation for each component is in-troduced in the following sections.3.1. Problem FormulationThe goal of the 3D semi-supervised learning is to jointlytrain the model based on limited labeled samples and a largenumber of unlabeled samples. Let XL = (xi, yi)NLi=1 be alimited labeled dataset with Nl samples, where xi ∈ RN×3is a 3D point cloud representation of an object or a scene,and yi is the corresponding label. Let XU = (xi)NUi=1 bean unlabeled set with NU samples, which does not con-tain labels. Our model is trained on both XL and XU forsemi-supervised learning with the proposed class-level con-fidence based dynamic threshold and re-sampling strategy.3.2. Baseline: FixMatchConsistency regularization is a commonly used con-straint in recent SSL algorithms [2, 1, 28]. It forces predic-tion results from different augmentation of same instancebeing consistent:µB�b=1||pm(y|α(ub)) − pm(y|α(ub))||22(1), where B represents the batch size of labeled data, µ is thelabeled data and unlabeled data ratio, α is a stochastic data6350对未标记数据的预测。伪标签的性能严重依赖于伪标签的质量。为了提高伪标签的质量,最先进的半监督学习方法FixMatch[25]和许多类似FixMatch的方法通常设置一个固定的高置信度阈值,以过滤掉强增强数据中的低置信度预测。高值阈值可以提高伪标签的质量,但忽视了每个类别的学习状态,这不仅导致对高学习状态类别的偏见,还使大量未标记数据未被使用。为了解决这个问题,Dash[38]使用交叉熵损失来获得所有类别的动态阈值。FlexMatch[43]用课程学习替代预定义的阈值,以考虑每个类别的学习状态。然而,我们的实验证明FlexMatch在3D数据集中不具有良好的泛化性能。这是因为它是为类别平衡的数据集设计的,而3D数据集本质上是不平衡的。此外,在3D网络中,某些类别的预测置信度无法达到预定义的高阈值,并使这些类别的阈值极小。因此,FlexMatch中的学习状态估计策略不适用于3D半监督任务。有关与FlexMatch的更多比较可以在补充材料中找到。0类别不平衡的半监督学习:最近,类别不平衡的半监督学习引起了越来越多的关注,因为它更准确地描述了现实世界的数据分布[40,9]。Wei等人[33]发现原始的半监督学习方法通常对头部类别具有高召回率和低精确度,并提出了基于标记数据数量重新采样未标记数据的CReST方法。最新的最先进方法BiS[8]同时采用了两种不同的重新采样策略来解耦模型的训练。所有这些类别不平衡的半监督学习方法都是基于数据数量进行重新采样的。然而,我们发现一些少数类别可能比多数类别具有更好的性能,因为它们的学习难度较低。基于数据数量的采样使模型对这些学习难度较低的类别产生偏见。由于页面限制,我们在补充材料中添加了与最先进的类别不平衡半监督学习方法的比较。03D半监督目标分类:目前,已经提出了许多用于3D理解的3D目标分类方法[20, 21, 29, 34, 37, 44, 45, 36,36]。与2D特征不同,3D模型本质上是复杂的,因此很难提取。为了更好地提取3D特征,许多工作[14, 20, 21,32]已经提出从3D点云中提取特征用于3D分类任务。然而,3D半监督分类还未充分利用。Chen等人[4]发现直接实现2D半监督方法如FixMatch [25]、S4L [42]和Pseudo label[12]在2D上无法达到可比较的结果,并提出利用3D半监督分类中的多模态信息。0然而,这些2D半监督方法在3D中的性能下降尚待探索。3D半监督目标检测:根据输入数据格式,当前的3D目标检测方法可以总结为三种不同类型:2D投影[13, 24,39]、体素网格[11, 22, 27]和点云[10, 18, 23,19]。尽管这些方法取得了令人印象深刻的结果,但高质量的3D真值收集起来既昂贵又耗时。由于减少对标记数据的依赖能力,半监督3D目标检测引起了研究人员的广泛关注[46,31]。然而,当前的3D半监督检测方法都是类似FixMatch的方法,并利用固定阈值选择伪标签。它们都没有考虑学习难度和类别不平衡情况的变化,导致了次优结果。在这项工作中,提出了一种基于类别级置信度的3D半监督方法,用于动态设置阈值并根据学习状态重新采样数据。Nonlinear mapping…… …Prediction confidenceEstimated learning status of each class …Class-levelconfid…… …Re-resamplingbased onestimatedlearning statusAdaptiveThresholdsUnlabeled Set:Average based onpsd-labelFigure 2: An overview of our proposed method. Our model consists of three main parts: (1) Obtaining the learning statusfor each class through the class-level confidence from unlabeled data, (2) Leveraging learning status to dynamically adjustingthe threshold of each class , and (3) Re-sampling the dataset based on the learning status.augmentation function, ub is the unlabeled data from XU,and pm is the output probability of the model. Another pop-ular method in SSL is pseudo-labeling, which obtain pseudolabels from unlabeled data prediction results. It defines afixed threshold to cut off high-confidence unlabeled data torender pseudo labels. The cross-entropy loss is utilized tominimize the difference of the predictions and hard pseudo-labels:1µBµB�b=11(max(pm(y|α(ub)) ≥ τ)·H(ˆpm(y|α(ub), pm(y|α(ub))(2), where ˆpm(y|α(ub) = arg max(pm(y|α(ub)) and τ is thethreshold.H(p, q) represents the cross entropy loss be-tween p and q. Usually, a high threshold τ will be used tofilter out low quality pseudo labels that have low predictionconfidence.Recently, FixMatch [25] combines consistency regular-ization and pseudo-labeling together and achieved state-of-the-art performance on many tasks [31, 46, 4]. FixMatchcontains a supervised loss ℓs and a unsupervised loss ℓu.The supervised loss is defined as:ℓs = 1BB�b=1H(yb, pm(y|α(xb))(3), where yb is the label of labeled instance xb. For unsu-pervised loss ℓu, FixMatch chooses the confident predic-tions (larger than the threshold) from weak augmented dataas pseudo labels. Then, a cross-entropy loss is minimizedbased on the network prediction from the strong augmentedviews of the data and this pseudo label. The unsupervisedℓu =1µBµB�b=11(max(pm(y|α(ub)) ≥ τ)·H(ˆpm(y|α(ub), pm(y|A(ub))(4)6360损失函数的公式为:0在FixMatch和类似的方法中,阈值τ通常是一个较高的常数。尽管这样的高阈值可以提高伪标签的质量,但它会减少实际用于优化网络的伪标签数量,使大量未标记数据未被使用。03.3. 基于类别级置信度的动态阈值0受FlexMatch[43]的启发,我们提出了一种基于类别级置信度的动态阈值,以利用每个类别的学习状态。在现有的SSL方法中,实例级别的预测置信度被用来评估实例的质量,但类别级置信度仍未被利用。我们的分析表明,对于每个类别,它们在未标记数据上的类别级置信度可以用来表示学习状态。我们可以利用估计的学习状态动态调整每个类别的阈值,从而提高SSL的效果。对于每个类别,我们从预测概率argmax中获取其未标记集合:{C c | u b ∈ C c , arg max( p m ( y | α ( ub ))) = c, b = 1 , 2 , ..., µB}。然后,对每个未标记类别集合进行平均处理。Pc =1|Cc||Cc|�j=0max(pm(y|α(uj)), uj ∈ Cc(5)τe(c) =1 − τ,if M(Pc) < 1 − ττ,elif M(Pc) > τM(Pc),else(6)ˆyic = 1 [pi ≥ τe(ci)](7)ℓu,e =1µBµB�b=1H(ˆyic, pm(y|A(ub))(8)ℓ = λsℓs + λuℓu,e(10)6370通过获得类别级置信度来提高学习状态。0然后,利用非线性函数将类别级置信度映射到学习状态。整个过程得到的动态阈值公式为:0其中,P c 是类别 c 的类别级置信度,M(x) = x0其中,2 − x是一个非线性映射函数,τ e ( c)是第e个时期类别c的动态阈值。由于未标记数据没有标签,对于每个未标记实例u i,网络预测的argmax被用作其类别:c i = arg max( p m (y | α ( u i )))。高质量的伪标签通过动态阈值进行过滤:0, 其中p i = max( p m ( y | α ( u i)))。降低低学习状态类别的阈值可以增加伪标签数量并改善学习状态。由于我们提出的方法仅基于类别级置信度调整阈值,因此可以应用于任何类型的数据集,并具有更高的泛化能力。提出的动态阈值方法的无监督损失函数的公式为:03.4. 基于类别级置信度的数据重采样0虽然我们提出的动态阈值可以增加低学习状态类别的伪标签数量,但由于数据不平衡和学习难度的差异,它仍然无法完全平衡每个类别的学习状态。例如:在ModelNet40数据集中,飞机和碗的标签数量分别为563和59。即使动态阈值过滤了一半的飞机伪标签并利用了所有的碗伪标签,飞机的选定未标记数据数量至少是碗的选定未标记数据数量的四倍。此外,由于其独特的形状,飞机的学习难度比碗更低。因此,即使使用了动态阈值,像飞机这样的类别仍然具有较高的学习能力,并且由于其丰富的数据数量、低学习难度或两者兼而有之,往往容易过拟合,这会影响网络性能。0为了缓解这个问题,我们采用了重新采样策略,这在SSL类别不平衡数据集中已被证明是有效的。目前大多数SSL不平衡方法都是基于数据数量进行采样[33,8]。然而,我们发现由于学习难度较低,一些少数类别可能比多数类别表现更好。基于数据数量的采样使得模型偏向于那些学习难度较低的类别。因此,我们提出了一种基于类别级置信度的重新采样策略,直接增加低学习状态类别的采样概率,同时考虑学习难度和数据不平衡。每个类别的采样概率公式如下:� 1 − W ( e ) ∙ P c ∙ p i ,如果 P c > τ,2 − W ( e ) ∙ P c ∙ p i ,如果 P c ≤ τ ,(9)0其中,热函数 W ( e ) = exp ( − 5 × (1 − e/E max ) 2 )遵循之前的工作[41, 15]以避免过于激进的采样。p i 是实例i 的预测置信度,c 是实例 i 的预测类别,P c 是类别 c的类别级置信度,e 是当前轮次,E max 是最大轮次。03.5. 最终目标函数0我们方法的核心思想是根据学习状态动态调整伪标签阈值并重新采样数据。因此,所提出的方法可以轻松应用于其他基于伪标签的方法。我们的整个模型使用两个损失函数进行联合训练,包括标记数据上的监督损失 ℓ s 和无标记数据上的 ℓu,e :0其中 λ s 和 λ u 是标记和无标记损失的权重。04. 实验结果04.1. 数据集0分类数据集:按照最先进的SSL3D物体分类方法,我们在两个基准数据集上评估我们的方法,包括ScanObjectNN [30]和ModelNet40[35]。ModelNet40是一个广泛使用的基准数据集,包含40个类别的12,311个网格CAD模型,其中训练集有9,843个模型,测试集有2,468个模型。ScanObjectNN是一个更真实的点云物体数据集,包含15个类别的15,000个物体,这些物体来自于现实世界中的2,902个唯一物体实例。检测数据集:按照之前最先进的SSL3D物体检测方法[31],我们在两个广泛使用的检测基准上评估我们的方法。2%5%10%OverallMeanOverallMeanOverallMeanModelNet40Point Transformer[7]71.161.077.169.284.677.2PL[12]69.759.678.369.085.177.7Flex-PL[43]66.754.974.262.383.270.3Confid-PL(Ours)74.461.980.673.586.580.4FixMatch[25](NeurIPS 2020)70.862.778.971.185.579.4Dash[38](ICML 2021)71.563.079.771.885.980.1FlexMatch[43](NeurIPS 2021)70.161.280.570.486.278.7Confid-Match(Ours)73.864.182.174.387.882.51%2%5%OverallMeanOverallMeanOverallMeanScanObjectNNPoint Transformer[7]32.126.144.736.556.650.0PL[12]31.225.847.538.658.151.5Flex-PL[43]29.224.247.237.660.151.9Confid-PL(Ours)32.627.148.841.563.155.2FixMatch[25](NeurIPS 2020)33.527.647.439.959.452.4Dash[38](ICML 2021)35.129.350.344.162.860.3FlexMatch[43](NeurIPS 2021)34.226.248.539.763.457.2Confid-Match(Ours)38.232.757.048.669.465.5objectn-6380数据集 方法0准确率 准确率 准确率 准确率 准确率 准确率0Table 1: 与最先进的方法的比较。在ModelNet40数据集上进行的3D半监督物体分类任务的结果。0数据集 方法0准确率 准确率 准确率 准确率 准确率 准确率0表2:与最先进方法的比较。在ScanObjectNN数据集上进行的3D半监督物体分类任务的结果。0包括SUN RGB-D [26]和ScanNet [5]。ScanNet[5]是一个室内场景数据集,包含1513个重建的网格模型,其中1201个是训练样本,312个是验证样本。SUN RGB-D[26]包含超过10,000个室内场景,其中5285个用于训练,5050个用于验证。04.2. 实现细节0半监督3D物体分类:在ModelNet40和ScanObjectNN数据集上,我们使用学习率为0.01的SGD优化器,并使用最小学习率为0.0001的CosineAnnealingLR衰减调度来调整学习率。所有模型的总训练轮数为500。弱数据增强包括旋转和随机缩放,强数据增强还包括随机缩放、平移、抖动和旋转。批量大小设置为240,其中48个样本是有标签的数据,其余为无标签数据。有监督损失和无监督损失的权重都为1。阈值设置为τ =0.8。重新采样策略每50个轮次更新一次数据加载器。半监督分类任务中使用PointTransformer[7]作为骨干网络。半监督3D物体检测:我们将我们的方法应用于最先进的3DIoUMatch工作,并遵循相同的设置。与3DIoUMatch使用VoteNet预训练模型不同,我们利用提出的重新采样策略在预训练过程中重新采样有标签的数据。然后使用预训练的权重来初始化0学生和教师网络。对于那些多物体场景,重新采样过程中利用具有最小置信度的物体。与分类任务一样,重新采样策略每50个轮次更新一次数据加载器。为了公平比较,预处理数据方法和标签与之前的工作[18,31]相同,并使用IoU阈值为0.25和0.5的均值平均精度(mAP)作为评估指标。阈值也设置为τ = 0.8。04.3. 半监督3D物体分类性能0为了展示我们提出方法的能力和潜力,我们将我们的方法与其他半监督学习方法(包括Pseudo-Labeling (PL)[12]、FixMatch [25]、Dash [38]和FlexMatch[43])在ModelNet40 [35]和ScanObjectNN[30]上进行了性能比较。FlexMatch[43]是最近提出的最先进方法,通过提出课程伪标签来动态调整阈值,克服了FixMatch的固定阈值缺点。为了公平比较,所有方法使用相同的骨干网络、数据增强和超参数。为了与最先进方法进行广泛比较,我们将我们的方法应用于FixMatch和Pseudo-labeling,并报告了所有方法在不同标记数据百分比下的结果。使用整体准确率和1%2%5%mAPmAPmAPmAPmAPmAP@ 0.25@0.50@0.25@0.50@0.25@0.50SUN RGB-DVoteNet [18](ICCV 2019)16.7±1.23.9±0.921.8±1.65.1±0. 833.9±1.913.1±1.7SESS [46](CVPR 2020)19.9±1.66.3±1.223.3±1.17.9±0.836.1±1.116.9±0.93DIoUMatch [31] (CVPRR 2021)25.6±0.69.4±0.726.8±0.710.6±0.539.7±0.920.6±0.7Confid-3DIoUMatch(Ours)27.8±0.811.3±0.632.7±0.313.5±0.443.1±0.624.2±0.51%2%5%@ 0.25@0.50@0.25@0.50@0.25@0.50ection.cyathe-ven6390数据集方法0表3:与SUN RGB-D数据集上最先进的方法的比较研究,用于3D SSL物体检测。0数据集 方法0mAP mAP mAP mAP mAP mAP0ScanNet0VoteNet [18](ICCV 2019)8.9±1.1 1.5±0.5 16.9±1.3 4.7±0.8 31.2±1.1 14.7±0.70SESS [46](CVPR 2020)11.3±1.6 2.7±0.6 21.1±1.5 8.4±1.1 35.5±2.0 17.2±0.903DIoUMatch [31](CVPRR 2021)14.6±1.4 3.9±0.5 24.5±1.9 11.2±1.4 40.4±0.8 21.0±0.60Confid-3DIoUMatch(我们的方法)19.0±0.4 6.4±0.4 29.5±1.5 15.2±0.6 43.6±0.5 24.3±0.40表4:与ScanNet数据集上最先进的方法的比较研究,用于3D SSL物体检测。0类别平均准确率,即所有类别准确率的平均值。表1和表2表明,在3DSSL分类任务中,当前最先进的工作FlexMatch在应用于FixMatch和Pseudo-Labeling的有限标记数据时,只有有限的改进甚至性能下降。这是因为FlexMatch只适用于类别平衡的数据集,而3D数据集本质上都是数据不平衡的。如表1所示,我们的模型在ModelNet40数据集上以两个评估指标优于所有最先进的方法。如表2所示,在更现实和具有挑战性的ScanObjectNN[30]数据集上,我们的模型也显著优于所有其他方法。对于ModelNet40 [35]和ScanObjectNN[30]数据集,我们的模型在平均类别准确率上的改进更为显著,这证明了我们的模型在平衡每个类别的学习状态方面的有效性。04.4. 半监督3D物体检测的性能0为了展示我们方法的泛化能力,我们进一步在半监督3D物体检测基准上评估了我们提出的方法,并与最先进的方法进行了比较。我们扩展了最先进的方法3DIoUMatch[31],并在训练过程中应用了我们的基于类别的阈值和重新采样。我们报告了与最先进的方法VoteNet [18]、SESS[46]和3DIoUMatch [31]在SUNRGB-D和ScanNet数据集上的性能比较。按照惯例,报告了两个不同阈值(0.25和0.5)下的平均精度(mAP)。如表3和表4所示,我们的模型在SUNRGB-D和ScanNet数据集上以不同的设置明显优于所有其他最先进的方法。0最显著的改进是在2%标记设置下,我们的方法在ScanNet和SUN RGB-D上的mAP@0.25上分别优于3DIoUMatch5.9和5.0。这两个基准上的结果表明,我们提出的基于置信度的动态阈值和学习状态平衡的重新采样策略可以轻松地集成到其他半监督方法中,显著提高性能。04.5. 动态阈值和重新采样的消融研究0我们提出的方法包含两个主要组成部分:基于置信度的动态阈值和动态重新采样策略。为了分析每个组成部分的效果,我们对SSL3D物体分类和检测任务的不同组合进行了消融研究。分类任务使用FixMatch[25]作为基线,检测任务使用3DIoUMatch[31]作为基线。表5包含了分类结果,而表6包含了检测任务的结果。动态阈值:对于分类和检测任务,基线使用固定阈值选择具有高质量预测的未标记数据。在将我们的类别级动态阈值策略应用于这两个不同任务后,不同设置下的性能都得到了改善。某些设置的改进非常大,例如在5%标记集下,ScanObjectNN数据集的平均准确率提高了10.1%。这些结果证实了我们的类别级动态阈值的有效性,并表明我们的方法可以轻松地集成到其他半监督学习方法中。动态重新采样:对于分类和检测任务,基线不使用任何重新采样策略,因此每个数据样本的采样概率都相同。对于SSL3D分类任务,所有的性能都没有使用任何重新采样策略。ConfidenceRe-sampleDynamicThresholdModelNet40 10%ObjectNN 5%Overall AccMean AccOverall AccMean Acc85.579.459.452.4✓86.781.164.160.5✓86.981.766.962.5✓✓87.882.569.465.5Table 5: Ablation study for components effect on the 3D SSL object classification task in ModelNet40 and ScanObjctNNdataset.Re-samplePre-trainConfidenceRe-sampleDynamicThresholdScanNet 5%SUN-RGBD 2%mAP @0.25mAP @0.5mAP @0.25mAP @0.540.4±0.821.0±0.626.8±1.110.6±0.5✓41.8±0.622.7±0.531.0±0.711.7±0.6✓✓42.1±0.823.2±0.531.7±0.812.4±0.5✓✓42.4±0.423.0±0.631.9±0.911.9±0.7✓✓✓43.6±0.524.3±0.432.7±0.313.5±0.4Table 6: Ablation study for components effect on the 3D SSL object detection task in ScanNet and Sun RGB-D dataset.mances are improved after applying our proposed dynamicre-sampling strategy, and the improvement on the realisticdataset ObjectNN is the most significant. For the SSL 3Ddetection task, performing the re-sampling strategy duringthe pre-train stage to re-sample labeled data only can sig-nificantly improve the performance, while the performancecan be further improved by also applying the re-samplingduring the semi-supervised training stage. The results onboth SSL 3D classification and detection benchmarks showthe effectiveness of the proposed re-sampling strategy.4.6. Ablation Study to Other Design ChoiceTo better understand our method, we conduct ablationstudies to evaluate the impact of upper limit of thresholdsand mapping functions. To comprehensively evaluate ourmethod, we provide the ablation results on both SSL 3Dclassification task with 10 percent labeled data i
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- NIST REFPROP问题反馈与解决方案存储库
- 掌握LeetCode习题的系统开源答案
- ctop:实现汉字按首字母拼音分类排序的PHP工具
- 微信小程序课程学习——投资融资类产品说明
- Matlab犯罪模拟器开发:探索《当蛮力失败》犯罪惩罚模型
- Java网上招聘系统实战项目源码及部署教程
- OneSky APIPHP5库:PHP5.1及以上版本的API集成
- 实时监控MySQL导入进度的bash脚本技巧
- 使用MATLAB开发交流电压脉冲生成控制系统
- ESP32安全OTA更新:原生API与WebSocket加密传输
- Sonic-Sharp: 基于《刺猬索尼克》的开源C#游戏引擎
- Java文章发布系统源码及部署教程
- CQUPT Python课程代码资源完整分享
- 易语言实现获取目录尺寸的Scripting.FileSystemObject对象方法
- Excel宾果卡生成器:自定义和打印多张卡片
- 使用HALCON实现图像二维码自动读取与解码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功