裸机测试与算法移植：效率对比与优化关键

需积分: 0 30 浏览量更新于2024-08-03 收藏 880KB DOCX 举报

本文档是一份关于裸机测试的初稿，旨在探讨在算能科技的边缘AI设备上进行的详细测试流程。首先，作者介绍了如何通过物理连接电脑与裸机的LAN口，使用工具如MobaXterm获取WAN口IP，并确保其在同一个网络段，以便进行后续的远程操作和通信。在算法移植方面，强调了Python代码的直接运行，而C++代码需要在本地虚拟机上进行模型转化和交叉编译。这个过程涉及到了特定的环境配置，如Docker镜像和交叉编译环境，以及对Ubuntu版本的注意。图2和图3展示了模型从PyTorch（PT）到ONNX的转换流程，图4则描绘了C++代码生成可执行文件并运行推理的步骤。功能性能测试部分重点关注边缘盒子的TPU，它主要用于模型推理，而预处理和后处理任务则在CPU上执行。文章详细分析了两种版本的YOLOv5（Python和C++）在单张图片识别上的运行效率。Python版本的平均运行时间是248.71ms，其中后处理占60%左右，而C++版本则显著更快，仅需86ms。这表明在实时性能要求高的场景下，C++版本更为适用，因为后处理优化对于提高整体速度至关重要。接着，作者进行了多线程测试，以考察CPU效率。测试涉及对单张图片进行resize处理，通过增加线程数量（1到10个线程），发现单张图片处理时间线性增长，同时CPU利用率也随之下降。这表明随着并发工作的增加，单个线程的处理负担加重，但整体的处理效率会有所提升。总结来说，这份文档涵盖了裸机测试的关键步骤，包括网络连接、代码移植、功能性能评估，以及对多线程处理性能的影响。对于优化边缘AI设备的部署和性能提升提供了有价值的参考和建议，期待读者提供反馈和改进意见。

算能科技裸机测试

一、WAN 口 IP 查询

利用网线将电脑与裸机 LAN 口直连（注意修改连接电脑端的 ip，使其与和自己 lan 口在同

一网段），并在本地上安装盒子机连接软件（如 xshell、MobaXterm 等，本次测试使用的是

MobaXterm），并通过相关命令（ipconfig、ip addr 等）查询 WAN 口 IP，并将其 IP 固定，如

图 1 所示（eth0 为 wan 口 IP）。

图 1 WAN IP 查询

二、算法移植流程测试

Python 代码可以直接在裸机上运行，c++代码须在本地机专门配置的虚拟机上进行模型转

化及交叉编译，将生成的可执行文件在盒子裸机上运行推理（模型转化须下载专门的 docker

镜像环境，可执行文件生成须配置专门的交叉编译环境，虚拟机上 Ubuntu 须注意版本）。

图 2 pt 模型转换

图 3 onnx 模型转换图 4 c++代码生成执行过程

三、功能性能测试

算能科技边缘盒子 TPU 上只进行模型推理，其他预处理、后处理在 CPU 上。

pt 模型

bmodel 模型

onnx 模型

mlir 模型

bmodel 模型

c++源文件

虚拟机上交叉编译

盒子机上推理运行

下载后可阅读完整内容，剩余7页未读，立即下载

m0_66890571

粉丝: 0
资源: 11

裸机测试与算法移植：效率对比与优化关键

单片机裸机开发经验

算能科技裸机测试补充相关内容

2440裸机测试源码

2440裸机测试程序

GT2440裸机测试程序

mini6410 裸机测试程序

mini2440裸机测试程序

micro2440LCD裸机测试

TQ2240开发板裸机测试程序

CC2530 裸机测试信号强度

最新资源