numpy 实现embedding 使用余弦相似度计算my-xent 损失

首先，我们需要定义一个嵌入矩阵 $E$，其中每一行代表一个单词的嵌入向量。假设我们有 $N$ 个单词，每个单词的嵌入向量为 $d$ 维，那么 $E$ 的形状将为 $N \times d$。我们可以使用 NumPy 的随机函数生成一个随机的嵌入矩阵： ```python import numpy as np N = 10000 d = 300 E = np.random.randn(N, d) ``` 接下来，我们需要选择一些中心单词 $c_i$，以及它们对应的正样本单词 $p_i$ 和负样本单词 $n_i$。我们可以使用 NumPy 的随机函数从嵌入矩阵 $E$ 中随机选择这些单词： ```python batch_size = 32 c_idx = np.random.randint(N, size=batch_size) e_c = E[c_idx] p_idx = np.random.randint(N, size=batch_size) e_p = E[p_idx] n_idx = np.random.randint(N, size=(batch_size, 5)) for i in range(batch_size): while p_idx[i] in n_idx[i]: n_idx[i] = np.random.randint(N, size=5) e_n = E[n_idx] ``` 接下来，我们可以计算每个中心单词 $c_i$ 和对应的正样本单词 $p_i$ 的余弦相似度： ```python cos_sim = np.sum(e_c * e_p, axis=1) / (np.linalg.norm(e_c, axis=1) * np.linalg.norm(e_p, axis=1)) ``` 然后，我们可以计算每个中心单词 $c_i$ 和对应的负样本单词 $n_{i,j}$ 的余弦相似度： ```python cos_sim_neg = np.sum(e_c[:, np.newaxis, :] * e_n, axis=2) / (np.linalg.norm(e_c, axis=1)[:, np.newaxis] * np.linalg.norm(e_n, axis=2)) ``` 接下来，我们需要将余弦相似度转换为概率分布，并计算 my-xent 损失。假设我们使用 softmax 函数将余弦相似度转换为概率分布，我们可以使用以下代码计算 my-xent 损失： ```python temperature = 0.1 logit = cos_sim / temperature logit_neg = cos_sim_neg / temperature logit_all = np.concatenate([logit[:, np.newaxis], logit_neg], axis=1) logit_all = np.exp(logit_all) probs = logit_all / np.sum(logit_all, axis=1)[:, np.newaxis] log_prob = np.log(probs[:, 0]) loss = -np.mean(log_prob) ``` 其中，`temperature` 是一个超参数。我们可以使用类似的方式计算每个中心单词 $c_i$ 和对应的负样本单词 $n_{i,j}$ 的 my-xent 损失。完整的代码示例如下： ```python import numpy as np N = 10000 d = 300 temperature = 0.1 # 生成随机嵌入矩阵 E = np.random.randn(N, d) # 选择中心单词和正样本单词 batch_size = 32 c_idx = np.random.randint(N, size=batch_size) e_c = E[c_idx] p_idx = np.random.randint(N, size=batch_size) e_p = E[p_idx] # 选择负样本单词 n_idx = np.random.randint(N, size=(batch_size, 5)) for i in range(batch_size): while p_idx[i] in n_idx[i]: n_idx[i] = np.random.randint(N, size=5) e_n = E[n_idx] # 计算余弦相似度 cos_sim = np.sum(e_c * e_p, axis=1) / (np.linalg.norm(e_c, axis=1) * np.linalg.norm(e_p, axis=1)) cos_sim_neg = np.sum(e_c[:, np.newaxis, :] * e_n, axis=2) / (np.linalg.norm(e_c, axis=1)[:, np.newaxis] * np.linalg.norm(e_n, axis=2)) # 计算 my-xent 损失 logit = cos_sim / temperature logit_neg = cos_sim_neg / temperature logit_all = np.concatenate([logit[:, np.newaxis], logit_neg], axis=1) logit_all = np.exp(logit_all) probs = logit_all / np.sum(logit_all, axis=1)[:, np.newaxis] log_prob = np.log(probs[:, 0]) loss = -np.mean(log_prob) ```

阅读全文

numpy 实现embedding 使用余弦相似度计算my-xent 损失

相关推荐

余弦相似度算法计算方法

Java基于余弦方法实现的计算相似度算法示例

（python）使用余弦相似度算法计算两个文本的相似度的简单实现

numpy 实现embedding 使用余弦相似度的my-xent

Python-Python3实现的文章余弦相似度计算

机器学习-余弦相似度计算图片相似性

numpy 实现nt-xent

2.9.5 余弦相似度-明鉴1

numpy-numpy使用示例之random-periodic.zip

numpy-numpy使用示例之mean-booststrapping.zip

余弦相似度推荐系统：基于余弦相似度的数学原理，使用静态数据构建简单的推荐系统

movie_recommender:使用余弦相似度的电影推荐

Numpy基础:数组和矢量计算-笔记与代码ch04Self.ipynb

基于numpy实现的简单神经网络框架-simnet.zip

python-2.7.9---numpy--pandas--detautil-mysqldb

numpy-html-1.16.1 numpy-ref-1.16.1 numpy-user-1.16.1

Numpy-ML-Basic-Operations-1

dsc-linalg-vector-matrices-numpy-lab-atlanta-ds-091619

03-python-numpy-简介-基础-数组-数组类型

numpy-基于numpy实现的图像处理算法之Adapt-RGB-decorator.zip

最新推荐

numpy库函数使用说明

Python-numpy实现灰度图像的分块和合并方式

在keras里面实现计算f1-score的代码

numpy实现神经网络反向传播算法的步骤

python Opencv计算图像相似度过程解析

Aspose资源包：转PDF无水印学习工具

管理建模和仿真的文件

【R语言高性能计算秘诀】：代码优化，提升分析效率的专家级方法

在构建视频会议系统时，如何通过H.323协议实现音视频流的高效传输，并确保通信的稳定性？

Go语言控制台输入输出操作教程