谷歌QuickDraw数据集与SketchRNN的潜伏空间可视化

需积分: 0 85 浏览量更新于2024-06-21 收藏 1.14MB PDF 举报

"藏经阁-Visualizing the Latent Space o.pdf" 这篇文档是关于通过SketchRNN、PCA（主成分分析）和t-SNE（t分布随机近邻嵌入）来可视化Google QuickDraw数据集中的向量绘图的潜在空间。Google QuickDraw数据集是一个庞大的资源，它包含了来自全球超过1500万人在“Quick, Draw!”人工智能实验中绘制的数百万幅作品。参与者被要求在20秒内画出特定类别的物体，如猫。 SketchRNN是一种创新的生成模型，利用这个数据集训练，可以生成矢量绘图。该模型结合了机器学习领域最新的工具和技术，比如变分自编码器（VAEs）、HyperLSTMs（为LSTM设计的超网络）。变分自编码器是一种无监督学习方法，用于学习数据的潜在表示，同时允许从潜在空间中采样生成新数据。HyperLSTM则是一种扩展的循环神经网络结构，它能够动态地生成其权重矩阵，增强了模型的表达能力。文章中提到的PCA是一种常用的降维技术，用于将高维数据投影到低维空间，以便更好地理解和解释数据的主要成分。然而，PCA通常保留的是方差最大的方向，而可能丢失了数据的非线性结构。 t-SNE是一种非线性降维技术，特别适合于可视化高维数据。它通过保持相似数据点在低维空间中的距离来保持数据的局部结构。在本案例中，t-SNE被用来在二维或三维空间中可视化QuickDraw数据集的复杂结构，使得我们可以直观地看到不同绘图类别之间的关系和分布。通过SketchRNN、PCA和t-SNE的结合应用，作者旨在探索和揭示QuickDraw数据集中不同向量绘图的内在关联和潜在模式。这种可视化可以帮助我们理解模型如何学习和代表这些手绘图像，以及在潜在空间中不同绘图类别的分布。此外，这也可能为改进模型性能、理解模型学习过程，甚至启发新的艺术创作提供洞见。总结来说，这篇文档深入探讨了如何利用先进的机器学习技术，特别是SketchRNN模型，对大规模的手绘数据进行建模和可视化。通过对Google QuickDraw数据集的分析，我们可以洞察人类创造性的潜在结构，并揭示机器学习模型在处理复杂视觉数据时的内在工作原理。这对于提升机器学习模型的理解，推动图像生成和识别技术的发展具有重要意义。

In[6]:

tf.logging.info("TensorFlow Version: {}".format(tf.__version__))

In[7]:

DATA_DIR = ('http://github.com/hardmaru/sketch-rnn-datasets/'

'raw/master/aaron_sheep/')

MODELS_ROOT_DIR = '/tmp/sketch_rnn/models'

In[8]:

DATA_DIR

In[9]:

PRETRAINED_MODELS_URL

In[10]:

download_pretrained_models(

models_root_dir=MODELS_ROOT_DIR,

pretrained_models_url=PRETRAINED_MODELS_URL)

We look at the layer normalized model trained on the aaron_sheep dataset for now.

In[11]:

MODEL_DIR = MODELS_ROOT_DIR + '/aaron_sheep/layer_norm'

In[12]:

(train_set,

valid_set,

test_set,

hps_model,

eval_hps_model,

sample_hps_model) = load_env(DATA_DIR, MODEL_DIR)

Getting the Pre-Trained Models and Data

INFO:tensorflow:TensorFlow Version: 1.1.0

Out[8]:

'http://github.com/hardmaru/sketch-rnn-datasets/raw/master/aaron_sheep/'

Out[9]:

'http://download.magenta.tensorflow.org/models/sketch_rnn.zip'

INFO:tensorflow:Downloading pretrained models from http://download.magenta.tensorflow.org/models/sketch_rnn.zip...

INFO:tensorflow:Download complete.

INFO:tensorflow:Unzipping /tmp/sketch_rnn/models/sketch_rnn.zip...

INFO:tensorflow:Unzipping complete.

INFO:tensorflow:Downloading http://github.com/hardmaru/sketch-rnn-datasets/raw/master/aaron_sheep/aaron_sheep.npz

INFO:tensorflow:Loaded 7400/300/300 from aaron_sheep.npz

INFO:tensorflow:Dataset combined: 8000 (7400/300/300), avg len 125

INFO:tensorflow:model_params.max_seq_len 250.

total images <= max_seq_len is 7400

total images <= max_seq_len is 300

INFO:tensorflow:normalizing_scale_factor 18.5198.

剩余14页未读，继续阅读

weixin_40191861_zj

粉丝: 83
资源: 1万+

谷歌QuickDraw数据集与SketchRNN的潜伏空间可视化

藏经阁-渐进式动画解决方案.pdf

Zeiler 和 Fergus - 2014 - Visualizing and Understanding Convolutional Networ.pdf

论文研究-The Visualizing of 3-Dimension Images with Visualization Toolkit.pdf

Bird-LS-2009-Measuring-function-duration-with-ftrace.pdf

ENVI-IDL全面提升影响价值.pdf

Hands-On Start to Wolfram Mathematica.pdf

Visualizing and Understanding Convolutional Networks.pdf

SvnViz - visualizing the source-开源

Content-based-Image-Retrieval.rar_After Method

OSU-CMR-VISTA-archive-refs-heads-master.zip

最新资源