CREStereo模型详解与参数解读

需积分: 0 36 浏览量更新于2024-08-04 收藏 38KB DOCX 举报

身份认证购VIP最低享 7 折!

30元优惠券

CREStereo-test 是一个专注于立体视觉的深度学习模型，用于估计场景中的深度图和视差（即两个视点之间像素级别的距离）。该模型的核心是基于CREStereo框架，它采用了深层卷积神经网络结构，旨在在高分辨率图像上实现精确的深度预测。模型参数设置中，关键部分包括： 1. model_path: 提供了一个预训练模型的路径，即"crestereo_eth3d.mge"，这表示模型是在ETH3D数据集上进行过训练的，这是一个常见的用于立体深度估计的大型数据集。 2. model_func: 使用提供的路径加载模型，这是初始化模型结构并准备进行推理或微调的函数。 3. pretrained_dict: 加载预训练模型的权重，使得模型可以从已经训练好的状态开始，加速学习过程或避免从头开始训练。 4. model: 模型实例化，配置了如下参数： - max_disp: 最大视差值为256，意味着模型能够处理的最大像素移动量。 - mixed_precision: 设置为False，意味着模型不使用混合精度计算，可能会牺牲一些性能但能提高内存效率。 - test_mode: 设为True，可能是在测试或验证阶段使用的模式，这可能影响模型的某些行为，比如启用或禁用某些优化。 5. hidden_dim 和 context_dim: 分别指定了隐藏层的维度，这两个参数对于神经网络的容量和表达能力至关重要。 6. dropout: 控制了随机失活的比例，有助于防止过拟合。 7. fnet: 使用BasicEncoder，这是一种基础的编码器结构，输出维度为256，采用instance_norm作为归一化方法。 8. norm_fn: 选择instance_norm作为网络内的归一化函数，这对于稳定网络的训练和提高性能有重要作用。 9. layer1: 包含一个ResidualBlock，其中包含卷积层、实例归一化层等，用于提取特征。 10. conv1, conv2, norm1, norm2, norm3: 一系列卷积层和归一化层，用于处理不同层次的特征。 11. downsample: 下采样层，用于减少特征图的空间分辨率同时增加通道数。 12. layer2: 另一个ResidualBlock，重复类似的设计，通常在网络更深的部分出现，以进一步提取更高级别的特征。整个模型设计遵循残差连接和递归结构，这在深度学习领域是常见的做法，有助于梯度传播和模型训练。通过调整这些参数，CREStereo-test能够适应不同的应用场景，并在立体视觉任务中提供高质量的深度估计结果。在实际应用中，可能还需要根据具体任务需求进行微调和优化。

资源详情

资源推荐

tmp.docx

3 / 11

10. eval_h=size[0]: 1024

11. eval_w=size[1]: 1536

12. left_img(left->resize(eval_h:1024, eval_w:1536)): (1024, 1536, 3)

13. right_img(right->resize(eval_h:1024, eval_w:1536)): (1024, 1536, 3)

14. pred(left_img, right_img, model_func{CREStereo}, n_iter=20->inference)

1) left=left_img: (1024, 1536, 3)

2) right=right_img: (1024, 1536, 3)

3) model=model{CREStereo(max_disp=256, mixed_precision=False, test_mode=True)}

4) n_iter: 20

5) imgL(left->CHW): (3, 1024, 1536)

6) imgR(right->CHW): (3, 1024, 1536)

7) imgL->BCHW: (1, 3, 1024, 1536)

8) imgR->BCHW: (1, 3, 1024, 1536)

9) imgL_dw2(imgL->interpolate(1024//2=512, 1536//2=768)): (1, 3, 512, 768)

10) imgR_dw2(imgR->interpolate(1024//2=512, 1536//2=768)): (1, 3, 512, 768)

11) pred_flow_dw2(image1=imgL_dw2, image2=imgR_dw2, iters=n_iter, flow_init=None

-> model{CREStereo(max_disp=256, mixed_precision=False, test_mode=True)})

A image1=2 * (image1 / 255) - 1=2*(imgL_dw2/255)-1: (1, 3, 512, 768) ∈[-1, 1]

B image2=2 * (image2 / 255) - 1=2*(imgR_dw2/255)-1: (1, 3, 512, 768) ∈[-1, 1]

C hdim=hidden_dim: 128

D fmap1([image1, image2]->fnet{BasicEncoder}[0])

A) x=[image1, image2]: [(1, 3, 512, 768), (1, 3, 512, 768)]

B) x->cat(0): (2, 3, 512, 768)

C) x->conv1->norm1->relu1: (2, 64, 256, 384) 【1/2 downsample】

D) x->layer1{Sequential(ResidualBlock(64->64), ResidualBlock(64->64))}

a x-> ResidualBlock(64->64)

a) y=x->conv1->norm1{InstanceNorm}->relu: (2, 64, 256, 384)

b) y->conv2->norm2->relu: (2, 64, 256, 384)

c) x->downsample: (2, 64, 256, 384)

d) x=x+y->relu: (2, 64, 256, 384)

b x-> ResidualBlock(64->64): (2, 64, 256, 384)

E) x->layer2{Sequential(ResidualBlock(64->96, s2), ResidualBlock(96->96))}: (2, 96, 128, 192)

【1/4 downsample】

F) x->layer3{Sequential(ResidualBlock(96->128), ResidualBlock(128->128))} : (2, 128, 128, 192)

G) x->conv2: (2, 256, 128, 192)

H) x->split(2, axis=0): [(1, 256, 128, 192), (1, 256, 128, 192)]

I) fmap1=x[0]: (1, 256, 128, 192)

E fmap2([image1, image2]->fnet{BasicEncoder}[1]) : (1, 256, 128, 192)

F fmap1_dw8(fmap1->avgPool(2*2)): (1, 256, 64, 96) 【1/8 downsample】

G fmap2_dw8(fmap2->avgPool(2*2)): (1, 256, 64, 96)

H offset_dw8(fmap1_dw8->conv_offset_8{Conv(256->18, 3*3)}): (1，18，64，96)

I offset_dw8->sigmoid-0.5->range_8=1*->*2: (1，18，64，96) ∈[-1, 1]

J net(fmap1->split([hdim=128], axis=1)[0])->tanh: (1, 128, 128, 192)

K inp(fmap1->split([hdim=128], axis=1)[1])->relu: (1, 128, 128, 192)

L net_dw8(net->avgPool(2*2)): (1, 128, 64, 96)

M inp_dw8(inp->avgPool(2*2)): (1, 128, 64, 96)

N fmap1_dw16(fmap1->avgPool(4*4)): (1, 256, 32, 48) 【1/16 downsample】

O fmap2_dw16(fmap2->avgPool(4*4)): (1, 256, 32, 48)

P offset_dw16(fmap1_dw16->conv_offset_16{Conv}->sigmoid-0.5 *2): (1, 18, 32, 48)∈[-1,1]

剩余10页未读，继续阅读

woshirenchengaji

粉丝: 1
资源: 1

CREStereo模型详解与参数解读

USR-TCP232-Test 串口转网络调试工具

ECU-TEST基本教程

输出20行字符串，对于第n个字符串:如果n为奇数输出 abcdn-test如果n为偶数输出 dcban-test 结果类似 贾瑶瑶 abcd1-test dcba2-test abcd3-test

nginx怎么设置 当请求10.0.0.0.1:9080/idms/idms-application-test时访问到10.0.0.2:29080/idms-application-test

usr-tcp232-test

引入react-screenshot-test报错

usr-tcp232-test使用教程

nginx怎么设置 当请求10.0.0.0.1:9080/idms/idms-application-test/a.json时访问到10.0.0.2:29080/idms-application-test/a.json

ECU-test新手入门

怎么更改parser.add_argument("--test_noiseL", type=float, default=50, help='noise level used on test set')为高斯噪声

perl-Test-Harness

phoronix-test-suite怎么使用

如何将Excel文件转化为可执行的ECU-Test文件

依赖检测失败： perl(Test::More) 被 mysql-community-test-8.0.28-1.el7.x86_64 需要

介绍一下g-test技术

pulsar-client consume \ persistent://public/default/pulsar-test \ -n 100 \ -s "consumer-test" \ -t "Exclusive"

parser.add_argument('--test_only', action='store_true', help='set this option to test the model')

Java导入spring-boot-starter-test依赖

linux i2c-test

最新资源

输出20行字符串，对于第n个字符串:如果n为奇数输出 abcdn-test如果n为偶数输出 dcban-test 结果类似贾瑶瑶 abcd1-test dcba2-test abcd3-test

nginx怎么设置当请求10.0.0.0.1:9080/idms/idms-application-test时访问到10.0.0.2:29080/idms-application-test

nginx怎么设置当请求10.0.0.0.1:9080/idms/idms-application-test/a.json时访问到10.0.0.2:29080/idms-application-test/a.json