用python利用数据 fat=[9.5,26.5,7.8,17.8,31.4,25.9,27.4,27.2,31.2,34.6,42.5,28.8,33.4,30.2,34.1,32.9,41.2,35.7]画盒图

时间: 2023-10-10 21:13:57 浏览: 210

对python制作自己的数据集实例讲解

### Python 制作自定义数据集详解 #### 一、数据集介绍本文将详细介绍如何使用 Python 创建自己的数据集，并以一个具体的例子——鲜花图像数据集为例进行演示。本例中的数据集名为“17_Category_Flower”，包含了17种在英国地区常见的鲜花类型，每种类型有80张图片，共计1360张图片。 #### 二、所需工具与库为了完成数据集的创建与处理，我们需要以下工具和库的支持： 1. **TensorFlow**：作为当前主流的机器学习框架之一，TensorFlow 提供了丰富的 API 和工具，能够支持数据集的创建、预处理以及模型训练等任务。 2. **os**：Python 的标准库之一，提供了与操作系统交互的功能，例如文件操作等。 3. **PIL (Python Imaging Library)**：这是一个用于处理图像的强大库，在 Python 社区中广泛使用。通过 PIL 库中的 Image 类，我们可以轻松地加载、处理和保存图像。 #### 三、代码实现详解 ##### 1. 制作 TFRecords 文件 TFRecords 是 TensorFlow 自带的一种数据存储格式，常用于存储大量的结构化数据。相比于传统的文本格式，TFRecords 格式更加紧凑高效，特别适合于大规模数据集的存储和处理。 ```python import os import tensorflow as tf from PIL import Image import matplotlib.pyplot as plt import numpy as np # 指定数据集路径 cwd = 'D:\\PyCharmCommunityEdition2017.2.3\\Work\\google_net\\jpg\\' # 定义鲜花类别 classes = {'daffodil', 'snowdrop', 'lilyvalley', 'bluebell', 'crocus', 'iris', 'tigerlily', 'tulip', 'fritiuary', 'sunflower', 'daisy', 'coltsfoot', 'dandelion', 'cowslip', 'buttercup', 'windflower', 'pansy'} # 初始化 TFRecords 文件 writer = tf.python_io.TFRecordWriter("flower_train.tfrecords") # 遍历所有类别 for index, name in enumerate(classes): class_path = cwd + name + '\\' # 遍历类别下的所有图片 for img_name in os.listdir(class_path): img_path = class_path + img_name # 加载并调整图片大小 img = Image.open(img_path) img = img.resize((224, 224)) # 将图片转换为二进制格式 img_raw = img.tobytes() # 创建 Example 对象 example = tf.train.Example(features=tf.train.Features(feature={ "label": tf.train.Feature(int64_list=tf.train.Int64List(value=[index])), 'img_raw': tf.train.Feature(bytes_list=tf.train.BytesList(value=[img_raw])) })) # 序列化 Example 并写入 TFRecords 文件 writer.write(example.SerializeToString()) # 关闭文件 writer.close() ``` **解释**： - 使用 `tf.python_io.TFRecordWriter` 来创建 TFRecords 文件。 - 对于每一张图片，使用 PIL 的 `Image.open` 方法加载图片，然后使用 `resize` 方法调整图片尺寸为 (224, 224)。 - 通过 `tobytes()` 方法将图片转换为二进制格式。 - 创建 `tf.train.Example` 对象，并使用 `tf.train.Feature` 封装标签 (`label`) 和图片数据 (`img_raw`)。 - 使用 `SerializeToString()` 方法将 `Example` 对象序列化为字符串，并通过 `writer.write` 写入到 TFRecords 文件中。 ##### 2. 读取 TFRecords 文件一旦 TFRecords 文件被创建，接下来就是如何从这些文件中读取数据。TensorFlow 提供了一套完整的 API 来处理这种文件格式。 ```python def read_and_decode(filename): # 读入 flower_train.tfrecords filename_queue = tf.train.string_input_producer([filename]) reader = tf.TFRecordReader() _, serialized_example = reader.read(filename_queue) features = tf.parse_single_example( serialized_example, features={ 'label': tf.FixedLenFeature([], tf.int64), 'img_raw': tf.FixedLenFeature([], tf.string) }) img = tf.decode_raw(features['img_raw'], tf.uint8) img = tf.reshape(img, [224, 224, 3]) img = tf.cast(img, tf.float32) * (1. / 255) - 0.5 label = tf.cast(features['label'], tf.int32) return img, label ``` **解释**： - 使用 `tf.train.string_input_producer` 创建一个队列，用于读取 TFRecords 文件。 - `tf.TFRecordReader` 用于读取队列中的数据。 - `tf.parse_single_example` 用于解析单个示例，从中提取出图片数据 (`img_raw`) 和标签 (`label`)。 - `tf.decode_raw` 用于解码图片的二进制数据。 - 调整图片的形状和数据类型，使其符合模型输入的要求。至此，我们已经完成了使用 Python 创建和读取 TFRecords 文件的过程。通过这种方式，我们可以高效地管理和处理大型数据集，这对于机器学习项目的开发来说是非常有价值的。

您可以使用Python中的matplotlib库来画盒图。以下是一个示例代码，用于绘制给定数据的盒图： ```python import matplotlib.pyplot as plt fat = [9.5, 26.5, 7.8, 17.8, 31.4, 25.9, 27.4, 27.2, 31.2, 34.6, 42.5, 28.8, 33.4, 30.2, 34.1, 32.9, 41.2, 35.7] plt.boxplot(fat) plt.title("Box Plot of Fat Data") plt.xlabel("Data") plt.ylabel("Fat") plt.show() ``` 这段代码将绘制一个盒图，其中x轴表示数据，y轴表示脂肪含量。请确保已安装matplotlib库。

阅读全文

用python利用数据 fat=[9.5,26.5,7.8,17.8,31.4,25.9,27.4,27.2,31.2,34.6,42.5,28.8,33.4,30.2,34.1,32.9,41.2,35.7]画盒图

相关推荐

PSO-BP回归预测模型：用Python实现高效数据挖掘

使用机器学习预测房屋价格：基于Python的数据分析

利用python实现数据分析

利用python进行数据分析

《利用python进行数据分析》数据集.rar

FatTree_fattree_Python构建fattree_python_mininet_源码

python 利用pyhive 导出excel 周数据

利用python进行数据分析笔记汇编.pdf

Data_Analysis:利用《利用Python进行数据分析（第二版）》源代码

python利用多进程、多线程实现网络数据下载（百度地图api中规划路径数据）

用python进行数据分析(老鼠书)python_for_data_analysis

python:利用python来分析一些财务报表数据

利用python下载网站数据

利用Python绘制MySQL数据图实现数据可视化

（南京大学）用python进行数据分析课件

Python项目数据：小费数据.zip

利用python数据分析-平均值.rar

python图像数据增强

Python库 | pineboo-0.99.9.5-py3-none-any.whl

最新推荐

利用Python实现Excel的文件间的数据匹配功能

利用python对excel中一列的时间数据更改格式操作

利用python和百度地图API实现数据地图标注的方法

用Python将Excel数据导入到SQL Server的例子

Java与Python之间使用jython工具类实现数据交互

火炬连体网络在MNIST的2D嵌入实现示例

管理建模和仿真的文件

L2正则化的终极指南：从入门到精通，揭秘机器学习中的性能优化技巧

如何构建一个符合GB/T19716和ISO/IEC13335标准的信息安全事件管理框架，并确保业务连续性规划的有效性？

Angular插件增强Application Insights JavaScript SDK功能