mediapipe0.8.9版本如何把holistic输出的2D坐标转化为归一坐标

时间: 2024-02-17 08:02:31 浏览: 22
在mediapipe0.8.9版本中,Holistic模型的输出结果包括身体关键点、面部关键点和手部关键点的2D坐标。这些2D坐标是相对于输入图像的像素坐标系的,它们的值通常是整数。为了将这些坐标转换为归一化坐标,需要进行如下操作: 1. 获取输入图像的宽度和高度。可以通过读取输入图像的shape属性来获取宽度和高度,例如: ``` input_image_height, input_image_width, _ = input_image.shape ``` 2. 将2D坐标的x和y值分别除以输入图像的宽度和高度,得到的结果就是归一化坐标。具体来说,可以使用如下代码将2D坐标转换为归一化坐标: ``` normalized_x = x / input_image_width normalized_y = y / input_image_height ``` 3. 重复步骤2,对所有的关键点坐标进行归一化处理。 通过这种方式,Holistic模型输出的2D坐标就被转换为了归一化坐标。这些归一化坐标可以用于后续的处理,例如计算关键点之间的距离、角度等。 需要注意的是,在使用Holistic模型时,需要保证输入图像的宽度和高度与模型训练时使用的图像大小相同。否则,将会导致输出的归一化坐标不准确,从而影响关键点的位置估计。
相关问题

mediapipe 0.8.9 用holistic_tracking_cpu.pbtxt输出右肩坐标

在Mediapipe 0.8.9中,可以使用Holistic模型进行人体姿态估计和跟踪,并输出右肩的坐标。具体方法如下: 1. 配置Holistic模型:在Mediapipe中,需要使用Holistic模型进行人体姿态估计和跟踪,可以通过MediaPipe框架提供的HolisticCalculator类或者直接使用HolisticGraph.pbtxt来进行配置。 2. 处理输入图像:在运行Holistic模型之前,需要将输入图像进行处理,将图像数据转换为TensorFlow的输入格式,并将其传递给Holistic模型进行处理。 3. 解析输出结果:在Holistic模型处理完毕后,可以从输出结果中解析出右肩的坐标。 4. 输出右肩坐标:根据Holistic模型输出的关键点编号,可以获取右肩的坐标。 下面是在Python中使用Holistic模型输出右肩坐标的示例代码: ```python import cv2 import mediapipe as mp # 配置Holistic模型 mp_holistic = mp.solutions.holistic holistic = mp_holistic.Holistic(static_image_mode=False, min_detection_confidence=0.5, min_tracking_confidence=0.5) # 加载图像 image = cv2.imread('image.jpg') # 处理输入图像 image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) results = holistic.process(image) # 解析输出结果 if results.pose_landmarks is not None: # 获取右肩坐标 right_shoulder_x = results.pose_landmarks.landmark[mp_holistic.PoseLandmark.RIGHT_SHOULDER].x right_shoulder_y = results.pose_landmarks.landmark[mp_holistic.PoseLandmark.RIGHT_SHOULDER].y right_shoulder_z = results.pose_landmarks.landmark[mp_holistic.PoseLandmark.RIGHT_SHOULDER].z # 输出右肩坐标 print('Right shoulder coordinate: ({}, {}, {})'.format(right_shoulder_x, right_shoulder_y, right_shoulder_z)) else: print('No pose landmarks detected.') ``` 需要注意的是,Holistic模型输出的坐标值是归一化的坐标值,范围在[0, 1]之间。如果需要将其转换为图像坐标或者其他坐标系的坐标值,需要进行相应的转换。

mediapipe 0.8.9 用holistic_tracking_cpu.pbtxt输出右肩坐标 c++

在 C++ 中使用 Holistic 模型输出右肩坐标的示例代码如下: ```c++ #include <iostream> #include <vector> #include "mediapipe/framework/formats/image_frame.h" #include "mediapipe/framework/formats/landmark.pb.h" #include "mediapipe/framework/formats/landmark_list.pb.h" #include "mediapipe/framework/port/opencv_highgui_inc.h" #include "mediapipe/framework/port/opencv_imgproc_inc.h" #include "mediapipe/framework/port/status.h" #include "mediapipe/framework/port/statusor.h" #include "mediapipe/framework/tool/options_util.h" #include "mediapipe/framework/tool/status_util.h" #include "mediapipe/framework/calculator_framework.h" #include "mediapipe/framework/calculator_graph.h" #include "mediapipe/framework/formats/matrix.h" #include "mediapipe/framework/formats/matrix_data.pb.h" #include "mediapipe/framework/formats/rect.pb.h" #include "mediapipe/framework/formats/rect.pb.h" #include "mediapipe/framework/formats/classification.pb.h" #include "mediapipe/framework/formats/detection.pb.h" #include "mediapipe/framework/formats/image_frame_opencv.h" #include "mediapipe/framework/formats/matrix.h" #include "mediapipe/framework/formats/matrix_data.pb.h" #include "mediapipe/framework/formats/matrix_opencv.h" #include "mediapipe/framework/formats/rect.pb.h" #include "mediapipe/framework/formats/rect.pb.h" #include "mediapipe/framework/formats/classification.pb.h" #include "mediapipe/framework/formats/detection.pb.h" #include "mediapipe/framework/formats/image_frame_opencv.h" #include "mediapipe/framework/formats/rect.pb.h" #include "mediapipe/framework/formats/rect.pb.h" #include "mediapipe/framework/formats/classification.pb.h" #include "mediapipe/framework/formats/detection.pb.h" #include "mediapipe/framework/formats/image_frame_opencv.h" #include "mediapipe/framework/formats/rect.pb.h" #include "mediapipe/framework/formats/rect.pb.h" #include "mediapipe/framework/formats/classification.pb.h" #include "mediapipe/framework/formats/detection.pb.h" #include "mediapipe/framework/formats/image_frame_opencv.h" #include "mediapipe/framework/port/opencv_highgui_inc.h" #include "mediapipe/framework/port/opencv_imgcodecs_inc.h" #include "mediapipe/framework/port/opencv_video_inc.h" #include "mediapipe/framework/port/opencv_videoio_inc.h" #include "mediapipe/util/resource_util.h" constexpr char kInputStream[] = "input_video"; constexpr char kOutputStream[] = "output_video"; constexpr char kLandmarksStream[] = "pose_landmarks"; constexpr char kWindowName[] = "MediaPipe"; using namespace mediapipe; int main() { // 初始化计算图 CalculatorGraphConfig config = mediapipe::ParseTextProtoOrDie<CalculatorGraphConfig>(R"( input_stream: "input_video" output_stream: "output_video" node { calculator: "HolisticTrackingCalculator" input_stream: "IMAGE:input_video" output_stream: "IMAGE:output_video" output_stream: "POSE_LANDMARKS:pose_landmarks" node_options: { [type.googleapis.com/mediapipe.HolisticTrackingCalculatorOptions] { min_detection_confidence: 0.5 min_tracking_confidence: 0.5 } } } )"); CalculatorGraph graph; MP_RETURN_IF_ERROR(graph.Initialize(config)); // 打开摄像头或者视频文件 cv::VideoCapture capture; capture.open(0); cv::namedWindow(kWindowName, cv::WINDOW_NORMAL); cv::resizeWindow(kWindowName, 720, 480); // 处理帧数据 while (capture.isOpened()) { bool grabbed = capture.grab(); if (!grabbed) break; cv::Mat input_frame; capture.retrieve(input_frame, cv::CAP_PROP_CONVERT_RGB); // 将 OpenCV 的 Mat 数据转换成 MediaPipe 的 ImageFrame 数据 auto input_frame_mat = absl::make_unique<cv::Mat>(input_frame); auto input_frame_image = absl::make_unique<ImageFrame>(ImageFormat::SRGB, input_frame.cols, input_frame.rows, ImageFrame::kDefaultAlignmentBoundary); cv::Mat input_frame_mat_bgr; cv::cvtColor(input_frame, input_frame_mat_bgr, cv::COLOR_RGB2BGR); cv::Mat input_frame_mat_bgr_flipped; cv::flip(input_frame_mat_bgr, input_frame_mat_bgr_flipped, /*flipcode=*/1); cv::Mat input_frame_mat_bgr_flipped_aligned; cv::Mat temp_output_frame = cv::Mat::zeros(input_frame_mat_bgr_flipped.rows, input_frame_mat_bgr_flipped.cols, input_frame_mat_bgr_flipped.type()); cv::rotate(input_frame_mat_bgr_flipped, temp_output_frame, cv::ROTATE_90_COUNTERCLOCKWISE); cv::rotate(temp_output_frame, input_frame_mat_bgr_flipped_aligned, cv::ROTATE_180); cv::Mat input_frame_mat_aligned; cv::cvtColor(input_frame_mat_bgr_flipped_aligned, input_frame_mat_aligned, cv::COLOR_BGR2RGB); memcpy(input_frame_image->MutablePixelData(), input_frame_mat_aligned.data, input_frame_mat_aligned.total() * input_frame_mat_aligned.elemSize()); input_frame_image->SetColorSpace(ImageFrame::ColorSpace::SRGB); input_frame_image->set_timestamp(Timestamp(capture.get(cv::CAP_PROP_POS_MSEC) * 1000)); // 向计算图输入数据 MP_RETURN_IF_ERROR(graph.AddPacketToInputStream( kInputStream, Adopt(input_frame_image.release()).At(Timestamp(capture.get(cv::CAP_PROP_POS_MSEC) * 1000)))); // 获取输出结果 mediapipe::Packet pose_landmarks_packet; if (graph.GetOutputLandmarkList(kLandmarksStream, &pose_landmarks_packet)) { auto& pose_landmarks = pose_landmarks_packet.Get<mediapipe::NormalizedLandmarkList>(); if (pose_landmarks.landmark_size() > 0) { // 获取右肩坐标 auto right_shoulder = pose_landmarks.landmark(11); std::cout << "Right shoulder coordinate: (" << right_shoulder.x() << ", " << right_shoulder.y() << ", " << right_shoulder.z() << ")" << std::endl; } } // 获取输出图像 mediapipe::Packet output_packet; if (graph.GetOutputPacket(&output_packet, kOutputStream) && !output_packet.IsEmpty()) { auto& output_frame = output_packet.Get<mediapipe::ImageFrame>(); cv::Mat output_mat = mediapipe::formats::MatView(&output_frame); cv::Mat output_mat_bgr; cv::cvtColor(output_mat, output_mat_bgr, cv::COLOR_RGB2BGR); cv::Mat output_mat_bgr_flipped; cv::flip(output_mat_bgr, output_mat_bgr_flipped, /*flipcode=*/0); cv::imshow(kWindowName, output_mat_bgr_flipped); } if (cv::waitKey(5) == 27) break; } // 关闭计算图 MP_RETURN_IF_ERROR(graph.CloseInputStream(kInputStream)); return graph.WaitUntilDone(); } ``` 需要注意的是,Holistic 模型输出的坐标值是归一化的坐标值,范围在[0, 1]之间。如果需要将其转换为图像坐标或者其他坐标系的坐标值,需要进行相应的转换。

相关推荐

最新推荐

recommend-type

node-v11.8.0-linux-arm64.tar.xz

Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。
recommend-type

C语言期末大作业之图书信息管理系统实现-基于Dev-C++实现.zip

c语言期末大作业 C语言期末大作业之图书信息管理系统实现_基于Dev-C++实现
recommend-type

node-v8.16.2-sunos-x64.tar.xz

Node.js,简称Node,是一个开源且跨平台的JavaScript运行时环境,它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立,旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎,可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型,这使得它非常适合处理大量并发连接,从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外,Node.js使用了模块化的架构,通过npm(Node package manager,Node包管理器),社区成员可以共享和复用代码,极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展,它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等,因此,开发者可以用JavaScript编写全栈应用程序,这一点大大提高了开发效率和便捷性。 在实践中,许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台,如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能,简化了开发流程,并且能更快地响应市场需求。
recommend-type

爬虫selenium需求geckodriver

爬虫selenium最新版本缺少的,快速拿去使用。
recommend-type

毕业设计基于 YOLOv8 和 LPRNet 的车牌识别系统python源码+模型.zip

1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设项目,作为参考资料学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。
recommend-type

RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz

REALTEK 8188FTV 8188eus 8188etv linux驱动程序稳定版本, 支持AP,STA 以及AP+STA 共存模式。 稳定支持linux4.0以上内核。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

实现实时数据湖架构:Kafka与Hive集成

![实现实时数据湖架构:Kafka与Hive集成](https://img-blog.csdnimg.cn/img_convert/10eb2e6972b3b6086286fc64c0b3ee41.jpeg) # 1. 实时数据湖架构概述** 实时数据湖是一种现代数据管理架构,它允许企业以低延迟的方式收集、存储和处理大量数据。与传统数据仓库不同,实时数据湖不依赖于预先定义的模式,而是采用灵活的架构,可以处理各种数据类型和格式。这种架构为企业提供了以下优势: - **实时洞察:**实时数据湖允许企业访问最新的数据,从而做出更明智的决策。 - **数据民主化:**实时数据湖使各种利益相关者都可
recommend-type

输出删除n个数字,使得被删后的数字最小

对于这个问题,我可以提供一个基于贪心算法的解法。具体来说,我们可以首先遍历一遍数字序列,从左往右找到第一个比它右边的数字大的位置,然后删除这个位置的数字,并重置遍历起点为当前位置。重复这个过程,直到已经删除了n个数字或者数字序列已经被完全遍历。 代码实现如下: ``` def remove_digits(num, n): result = [] for i in range(len(num)): while n > 0 and result and result[-1] > num[i]: result.pop()
recommend-type

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf

校园超市商品信息管理系统课程设计旨在帮助学生深入理解程序设计的基础知识,同时锻炼他们的实际操作能力。通过设计和实现一个校园超市商品信息管理系统,学生掌握了如何利用计算机科学与技术知识解决实际问题的能力。在课程设计过程中,学生需要对超市商品和销售员的关系进行有效管理,使系统功能更全面、实用,从而提高用户体验和便利性。 学生在课程设计过程中展现了积极的学习态度和纪律,没有缺勤情况,演示过程流畅且作品具有很强的使用价值。设计报告完整详细,展现了对问题的深入思考和解决能力。在答辩环节中,学生能够自信地回答问题,展示出扎实的专业知识和逻辑思维能力。教师对学生的表现予以肯定,认为学生在课程设计中表现出色,值得称赞。 整个课程设计过程包括平时成绩、报告成绩和演示与答辩成绩三个部分,其中平时表现占比20%,报告成绩占比40%,演示与答辩成绩占比40%。通过这三个部分的综合评定,最终为学生总成绩提供参考。总评分以百分制计算,全面评估学生在课程设计中的各项表现,最终为学生提供综合评价和反馈意见。 通过校园超市商品信息管理系统课程设计,学生不仅提升了对程序设计基础知识的理解与应用能力,同时也增强了团队协作和沟通能力。这一过程旨在培养学生综合运用技术解决问题的能力,为其未来的专业发展打下坚实基础。学生在进行校园超市商品信息管理系统课程设计过程中,不仅获得了理论知识的提升,同时也锻炼了实践能力和创新思维,为其未来的职业发展奠定了坚实基础。 校园超市商品信息管理系统课程设计的目的在于促进学生对程序设计基础知识的深入理解与掌握,同时培养学生解决实际问题的能力。通过对系统功能和用户需求的全面考量,学生设计了一个实用、高效的校园超市商品信息管理系统,为用户提供了更便捷、更高效的管理和使用体验。 综上所述,校园超市商品信息管理系统课程设计是一项旨在提升学生综合能力和实践技能的重要教学活动。通过此次设计,学生不仅深化了对程序设计基础知识的理解,还培养了解决实际问题的能力和团队合作精神。这一过程将为学生未来的专业发展提供坚实基础,使其在实际工作中能够胜任更多挑战。