写一个CNN的非极大抑制和训练

时间: 2024-02-19 07:58:20 浏览: 35
下面是一个简单的CNN训练和非极大抑制代码示例,使用了TensorFlow库: ```python import tensorflow as tf from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense from tensorflow.keras.optimizers import Adam from tensorflow.keras.utils import to_categorical from tensorflow.keras.preprocessing.image import ImageDataGenerator from tensorflow.keras.layers import Lambda import numpy as np import cv2 # 构建CNN模型 model = Sequential() model.add(Conv2D(32, (3,3), activation='relu', input_shape=(28,28,1))) model.add(MaxPooling2D((2,2))) model.add(Conv2D(64, (3,3), activation='relu')) model.add(MaxPooling2D((2,2))) model.add(Conv2D(64, (3,3), activation='relu')) model.add(Flatten()) model.add(Dense(64, activation='relu')) model.add(Dense(10, activation='softmax')) # 编译模型 model.compile(optimizer=Adam(lr=0.001), loss='categorical_crossentropy', metrics=['accuracy']) # 加载数据集 (x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data() # 将图像转换为float类型并进行归一化 x_train = x_train.astype('float32') / 255 x_test = x_test.astype('float32') / 255 # 将标签转换为one-hot编码 y_train = to_categorical(y_train) y_test = to_categorical(y_test) # 对训练数据进行增强 datagen = ImageDataGenerator(rotation_range=10, zoom_range=0.1, width_shift_range=0.1, height_shift_range=0.1) datagen.fit(x_train) # 训练模型 model.fit(datagen.flow(x_train, y_train, batch_size=32), epochs=10, validation_data=(x_test, y_test)) # 非极大抑制 def non_max_suppression(boxes, scores, threshold): # 计算框的面积 areas = (boxes[:, 2] - boxes[:, 0]) * (boxes[:, 3] - boxes[:, 1]) # 根据得分从高到低排序 order = scores.argsort()[::-1] keep = [] while order.size > 0: # 取得分最高的框 i = order[0] keep.append(i) # 计算当前框与其它框的交集面积 xx1 = np.maximum(boxes[i, 0], boxes[order[1:], 0]) yy1 = np.maximum(boxes[i, 1], boxes[order[1:], 1]) xx2 = np.minimum(boxes[i, 2], boxes[order[1:], 2]) yy2 = np.minimum(boxes[i, 3], boxes[order[1:], 3]) w = np.maximum(0, xx2 - xx1) h = np.maximum(0, yy2 - yy1) inter = w * h # 计算重叠度 overlap = inter / (areas[i] + areas[order[1:]] - inter) # 保留重叠度小于阈值的框 inds = np.where(overlap <= threshold)[0] order = order[inds + 1] return keep # 测试模型 img = cv2.imread('test.jpg') img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) img_gray = cv2.resize(img_gray, (28, 28)) img_gray = img_gray.astype('float32') / 255 img_gray = np.expand_dims(img_gray, axis=2) img_gray = np.expand_dims(img_gray, axis=0) predictions = model.predict(img_gray) class_idx = np.argmax(predictions) class_output = model.output[:, class_idx] last_conv_layer = model.get_layer('conv2d_3') grads = K.gradients(class_output, last_conv_layer.output)[0] pooled_grads = K.mean(grads, axis=(0, 1, 2)) iterate = K.function([model.input], [pooled_grads, last_conv_layer.output[0]]) pooled_grads_value, conv_layer_output_value = iterate([img_gray]) for i in range(64): conv_layer_output_value[:, :, i] *= pooled_grads_value[i] heatmap = np.mean(conv_layer_output_value, axis=-1) heatmap = np.maximum(heatmap, 0) heatmap /= np.max(heatmap) heatmap = cv2.resize(heatmap, (img.shape[1], img.shape[0])) heatmap = np.uint8(255 * heatmap) heatmap = cv2.applyColorMap(heatmap, cv2.COLORMAP_JET) output_image = cv2.addWeighted(img, 0.5, heatmap, 0.5, 0) cv2.imwrite('output.jpg', output_image) # 非极大抑制 boxes = np.array([[40, 40, 100, 100], [50, 50, 120, 120], [60, 60, 130, 130]]) scores = np.array([0.9, 0.75, 0.8]) threshold = 0.5 keep = non_max_suppression(boxes, scores, threshold) print(keep) ``` 在上面的代码中,我们首先定义了一个简单的CNN模型,并使用Keras库进行训练。然后,我们使用OpenCV库的函数对一张测试图片进行预测,并生成热力图。接着,我们定义了一个非极大抑制的函数,用于过滤掉重叠度高的框。最后,我们对一组测试框进行非极大抑制,并输出保留的框的索引。

相关推荐

最新推荐

recommend-type

基于caffe实现改进的mtcnn完成车牌识别.docx

P-Net的输出会经过非极大值抑制(NMS)来减少重复的检测框。 2. R-Net(Refinement Network):R-Net接收P-Net的输出,进一步筛选和精化候选框,提高检测的准确性。同时,R-Net也执行框回归和关键点定位任务。 3. ...
recommend-type

Node.js实战:快速入门,全面解析

"Node.js即学即用是一本面向JavaScript和编程有一定基础的读者的入门书籍,旨在教授如何利用Node.js构建可扩展的互联网应用程序。本书详尽介绍了Node.js提供的API,同时深入探讨了服务器端事件驱动开发的关键概念,如并发连接处理、非阻塞I/O以及事件驱动编程。内容覆盖了对多种数据库和数据存储工具的支持,提供了Node.js API的实际使用示例。" 在Node.js的世界里,事件驱动模型是其核心特性之一。这种模型使得Node.js能够高效地处理大量并发连接,通过非阻塞I/O操作来提高性能。在本书中,读者将学习如何利用Node.js的异步编程能力来创建高性能的网络应用,这是Node.js在处理高并发场景时的一大优势。 Node.js的API涵盖了网络通信、文件系统操作、流处理等多个方面。例如,`http`模块用于创建HTTP服务器,`fs`模块提供了对文件系统的读写功能,而`stream`模块则支持数据的高效传输。书中会通过实例来展示如何使用这些API,帮助读者快速上手。 对于数据库和数据存储,Node.js有丰富的库支持,如MongoDB的`mongodb`模块、MySQL的`mysql`模块等。书中会讲解如何在Node.js应用中集成这些数据库,进行数据的增删改查操作,以及如何优化数据访问性能。 此外,本书还会介绍Node.js中的模块系统,包括内置模块和第三方模块的安装与使用,如使用`npm`(Node Package Manager)管理依赖。这使得开发者可以轻松地复用社区中的各种工具和库,加速开发进程。 《Node.js即学即用》是一本全面的实战指南,不仅适合初学者快速掌握Node.js的基础知识,也适合有一定经验的开发者深入理解Node.js的高级特性和最佳实践。通过阅读本书,读者不仅可以学习到Node.js的技术细节,还能了解到如何构建实际的、可扩展的网络应用。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

nginx配置中access_log指令的深入分析:日志记录和分析网站流量,提升网站运营效率

![nginx配置中access_log指令的深入分析:日志记录和分析网站流量,提升网站运营效率](https://img-blog.csdnimg.cn/img_convert/36fecb92e4eec12c90a33e453a31ac1c.png) # 1. nginx access_log指令概述** nginx 的 `access_log` 指令用于记录服务器处理客户端请求的信息。它可以生成日志文件,其中包含有关请求的详细信息,例如请求方法、请求 URI、响应状态代码和请求时间。这些日志对于分析网站流量、故障排除和性能优化至关重要。 `access_log` 指令的基本语法如下:
recommend-type

opencvsharp连接工业相机

OpenCVSharp是一个.NET版本的OpenCV库,它提供了一种方便的方式来在C#和Mono项目中使用OpenCV的功能。如果你想要连接工业相机并使用OpenCVSharp处理图像数据,可以按照以下步骤操作: 1. 安装OpenCVSharp:首先,你需要从GitHub或NuGet包管理器下载OpenCVSharp库,并将其添加到你的项目引用中。 2. 配置硬件支持:确保你的工业相机已安装了适当的驱动程序,并且与计算机有物理连接或通过网络相连。对于一些常见的工业相机接口,如USB、GigE Vision或V4L2,OpenCV通常能够识别它们。 3. 初始化设备:使用OpenCVS
recommend-type

张智教授详解Java入门资源:J2SE与J2ME/J2EE应用

本PPT教程由主讲教师张智精心制作,专为Java初学者设计,旨在快速提升学习者的Java编程入门能力,以应对各类考试需求。教程内容涵盖了Java的基础知识和实用技巧,从语言的历史背景和发展到核心特性。 1. **Java简介**: - Java起源于1990年由James Gosling领导的小组,原名Oak,目标是为家用电器编程,后来在1995年更名为Java。Java是一种平台无关、面向对象的语言,其特点包括:平台无关性,通过JVM实现跨平台;面向对象,强调代码重用;简单健壮,降低出错风险;解释性,源代码编译成字节码执行;分布式,支持网络通信;安全,防止非法操作;多线程,支持并发处理;动态性和可升级性;以及高性能。 2. **Java平台版本**: - Java有三个主要版本: - 微型版(J2ME):针对移动设备和嵌入式设备,如手机或IoT设备。 - 标准版(J2SE,Java SE):适用于桌面和服务器开发,涵盖了日常应用开发。 - 企业版(J2EE,Java EE):为企业级应用和Web应用设计,如企业级服务器和Web服务。 3. **Java环境配置**: - 要开始Java编程,首先需要下载Java JDK,如Java 8。然后配置Java环境变量,例如设置JAVA_HOME指向JDK安装路径,CLASSPATH用于指定类库搜索路径,以及添加JDK bin和jre bin到PATH中,以便执行Java命令。 4. **常用IDE工具**: - Eclipse是一款推荐使用的Java IDE,它提供了集成开发环境,便于代码编写、调试和测试。下载Eclipse后,通常直接解压安装即可。 整个教程围绕Java的核心概念展开,从基础语法讲解到实践项目,适合初学者系统地学习和巩固Java知识,无论是为了学术研究还是职业发展,都能提供有效的学习资源。通过本资源,初学者能够快速掌握Java编程,并为进一步深入学习和实战项目打下坚实基础。
recommend-type

"互动学习:行动中的多样性与论文攻读经历"

多样性她- 事实上SCI NCES你的时间表ECOLEDO C Tora SC和NCESPOUR l’Ingén学习互动,互动学习以行动为中心的强化学习学会互动,互动学习,以行动为中心的强化学习计算机科学博士论文于2021年9月28日在Villeneuve d'Asq公开支持马修·瑟林评审团主席法布里斯·勒菲弗尔阿维尼翁大学教授论文指导奥利维尔·皮耶昆谷歌研究教授:智囊团论文联合主任菲利普·普雷教授,大学。里尔/CRISTAL/因里亚报告员奥利维耶·西格德索邦大学报告员卢多维奇·德诺耶教授,Facebook /索邦大学审查员越南圣迈IMT Atlantic高级讲师邀请弗洛里安·斯特鲁布博士,Deepmind对于那些及时看到自己错误的人...3谢谢你首先,我要感谢我的两位博士生导师Olivier和Philippe。奥利维尔,"站在巨人的肩膀上"这句话对你来说完全有意义了。从科学上讲,你知道在这篇论文的(许多)错误中,你是我可以依
recommend-type

nginx配置中error_page指令的实战应用:自定义错误页面、提升用户体验,提升网站友好性

![nginx配置中error_page指令的实战应用:自定义错误页面、提升用户体验,提升网站友好性](https://i-blog.csdnimg.cn/blog_migrate/922682c45f8a00d03d9504300a3ade98.png) # 1. Nginx错误处理概述** Nginx作为一款高性能的Web服务器,提供了一系列错误处理机制,帮助管理员及时发现和处理服务器错误。其中,error_page指令是Nginx错误处理中的核心指令,它允许管理员自定义错误页面,为用户提供友好的错误提示,并帮助管理员快速定位和解决问题。 error_page指令的语法为: ```
recommend-type

stm32f103c8t6 tim3 pwm

STM32F103C8T6是一款基于ARM Cortex-M3内核的微控制器,它内置了TIM3(Timer 3)定时器模块。TIM3是一个高级定时器,支持PWM(脉冲宽度调制)功能,常用于控制电机速度、LED亮度等需要模拟信号的应用。 TIM3 PWM工作原理大致如下: 1. 配置TIM3:首先需要配置定时器的工作模式,比如计数模式或PWM模式,并设置预分频器(Prescaler)、周期长度、以及通道的极性、相位等。 2. 设置占空比:通过寄存器设置PWM的高电平时间(高周期)与低电平时间(低周期)的比例,也就是我们常说的 Duty Cycle。 3. 开始定时:启用TIM3的计数器,一旦到
recommend-type

解决信息过载:文本挖掘与链接检测手册

《文本挖掘手册》是一本专著,深入探讨了计算机科学领域中的新兴且令人兴奋的研究分支——文本挖掘。在当今信息爆炸的时代,文本挖掘旨在通过整合数据挖掘、机器学习、自然语言处理、信息检索和知识管理等多种技术手段,解决信息过载的问题。其核心目标是利用高效的算法和技术,从海量文本资料中提取有价值的信息,发现隐藏模式和趋势,以及构建和维护实体间的关联网络。 文本挖掘的主要任务包括:首先,从大量数据源中抓取并整理稀疏证据,这要求系统具有强大的数据获取和预处理能力。其次,对收集到的相关证据进行有效表示和评估,以确定其重要性和可信度。最后,通过不断学习和优化,系统能够识别和链接实体,形成一个动态的、具有洞察力的知识网络,帮助用户更好地理解和利用他们的文本数据资源。 在《文本挖掘手册》中,作者不仅深入剖析了文本挖掘的核心概念和技术,如词频分析、情感分析、主题模型等,还详细介绍了链接检测这一关键领域的发展。链接检测是一种快速发展的文本分析方法,它利用网络结构来揭示文本中的关系和关联。通过构建对象间的连接,如关键词、实体或概念之间的共现、相似性或引用,链接检测可以帮助我们发现隐藏的关联,从而支持更高级别的信息理解和决策。 此外,该手册还涵盖了最新的研究成果和实践应用,如网络爬虫技术用于大规模文本数据的获取,深度学习在文本分类和聚类中的应用,以及如何将文本挖掘与大数据分析、云计算和人工智能相结合,以实现更智能的数据分析和决策支持。 《文本挖掘手册》为读者提供了一个全面的指南,无论你是研究人员、工程师还是数据分析师,都可以从中获得理论基础和实战技巧,以便在信息时代有效地挖掘和利用文本数据的潜在价值。通过掌握文本挖掘和链接检测的最新进展,读者能够应对日益增长的数据挑战,推动组织和个人在知识管理和业务洞察方面取得突破。