E = sparse(1:n,label,1,n,k,n);

时间: 2024-06-02 18:12:49 浏览: 65
这段代码是用来创建一个稀疏矩阵 E 的。其中参数 n 是矩阵的行数,参数 k 是矩阵的列数,参数 label 是一个长度为 n 的向量,表示每个元素所属的列。具体而言,对于矩阵中的第 i 行,其第 label(i) 列的元素为1,其余元素都为0。 这个矩阵常用于表示分类问题中的标签。例如,如果有 n 个样本,每个样本属于 k 个类别中的一个,那么可以用一个长度为 n 的向量 label 表示每个样本所属的类别,然后用这个代码生成一个稀疏矩阵 E 表示所有样本的类别信息。这个矩阵可以方便地用于计算损失函数或者评估模型性能等任务。
相关问题

function [BTY] = cal_Bty_by_y(Y,m,n) d = m*n; P = reshape(Y(1:d, :), [m, n]); Q = reshape(Y(d+1:2*d, :), [m, n]); BTY1 = zeros(d, 1); BTY2 = zeros(d, 1); Dm = sparse(diag([0; ones(m-1, 1)]) + diag(-ones(m-1, 1), -1)); for i = 1:n % Compute Dm * Xi and store it in the appropriate position in Y BTY1((i-1)*m+1:i*m, 1) = Dm' * P(:,i); end BTY2(1:m, 1) = Q(:, 2)*(-1); for i = 2:n-1 % Compute Dm * Xi and store it in the appropriate position in Y BTY2((i-1)*m+1:i*m, 1) = Q(:,i) - Q(:,i+1); end BTY2((n-1)*m+1:n*m, 1) = Q(:,n); BTY = BTY1+BTY2; clear BTY1; clear BTY2; end

这也是一个 MATLAB 函数,用于计算一个矩阵 Y 的 BTY 值。与之前的函数类似,BTY 值也是通过对 Y 进行垂直方向和水平方向的差分计算得出的。 具体来说,该函数首先定义了一个大小为 d 的零向量 BTY1 和 BTY2,其中 d = m*n,m 和 n 分别为矩阵 Y 的行数和列数。然后,它使用了 MATLAB 的 reshape 函数将 Y 转换为两个大小为 m*n 的矩阵 P 和 Q。接下来,该函数使用了 MATLAB 的 sparse 函数创建一个大小为 (m-1)*m 的对角矩阵 Dm,该矩阵的对角线元素为 1,其下对角线元素为 -1。接下来,该函数使用两个 for 循环,分别对矩阵 Y 的每一列进行操作,计算出 BTY1 和 BTY2 的值,最后将它们相加合并成一个大小为 2*d 的向量 BTY 并返回。 总的来说,该函数的作用是计算出一个矩阵的差分值,可以用于信号处理、图像处理等领域。

all_scores = []; n_samples = length(labels); n_class = length(unique(labels)); K = length(W); scores = cell(K,1); max_scores = zeros(K, n_samples); tmp_label = zeros(K, n_samples); for j=1:K projected_X = X * W{j}; scores{j} = projected_X * Y; [max_scores(j,:),tmp_label(j,:)] = max(scores{j}'); end [best_scores,best_idx] = max(max_scores,[],1); label_idx = sub2ind(size(tmp_label), best_idx, 1:n_samples); predict_label = tmp_label(label_idx); %compute the confusion matrix label_mat = sparse(labels,1:n_samples,1,n_class,n_samples); predict_mat = sparse(predict_label,1:n_samples,1,n_class, n_samples); conf_mat = label_mat * predict_mat'; conf_mat_diag = diag(conf_mat); n_per_class = sum(label_mat'); %mean class accuracy mean_class_accuracy = sum(conf_mat_diag ./ n_per_class') / n_class; %per sample accuracy mean_sample_accuracy = sum(conf_mat_diag) / n_samples;

这段代码是用于计算分类任务中的混淆矩阵和准确率的。让我解释一下它的逻辑: 首先,定义了一些变量,包括得分列表(all_scores)、样本数量(n_samples)和类别数量(n_class),以及一个矩阵W的长度(K)。 然后,创建了一些空的变量,包括得分矩阵(scores)、最大得分矩阵(max_scores)和临时标签矩阵(tmp_label)。 接下来,通过将输入矩阵X乘以每个权重矩阵W{j}来计算投影矩阵projected_X。然后,将投影矩阵projected_X与标签矩阵Y相乘,得到每个类别的得分矩阵scores{j}。 对于每个得分矩阵scores{j},找到每个样本的最大得分和对应的标签,并将它们存储在max_scores(j,:)和tmp_label(j,:)中。 接下来,找到所有样本中最大得分的索引和对应的标签,并将它们存储在best_scores和best_idx中。 使用best_idx和1:n_samples作为索引,从tmp_label中提取预测标签。 接下来,根据真实标签和预测标签创建稀疏矩阵label_mat和predict_mat,并计算它们的乘积,得到混淆矩阵conf_mat。 通过从混淆矩阵的对角线上获取元素,得到每个类别的正确预测数量conf_mat_diag。 计算每个类别的样本数量n_per_class。 计算平均类别准确率,即将每个类别的正确预测数量除以该类别的样本数量,并将结果相加后除以类别数量。 计算平均样本准确率,即将混淆矩阵对角线上的元素相加后除以样本数量。 这段代码的目的是评估分类模型的准确率和混淆矩阵,其中平均类别准确率是针对每个类别的样本数量进行加权的准确率指标,而平均样本准确率是针对所有样本的准确率指标。

相关推荐

优化下面代码class SparseMatrix: def __init__(self, row, col, num): self.row = row self.col = col self.num = num self.data = [] for i in range(num): self.data.append((0, 0, 0)) def set_value(self, i, j, value): if i < 0 or i >= self.row or j < 0 or j >= self.col: return False k = 0 while k < self.num and self.data[k][0] < i: k += 1 while k < self.num and self.data[k][0] == i and self.data[k][1] < j: k += 1 if k < self.num and self.data[k][0] == i and self.data[k][1] == j: self.data[k] = (i, j, value) else: self.data.insert(k, (i, j, value)) self.num += 1 def add(self, other): if self.row != other.row or self.col != other.col: return None i = j = k = 0 result = SparseMatrix(self.row, self.col, 0) while i < self.num and j < other.num: if self.data[i][0] < other.data[j][0] or ( self.data[i][0] == other.data[j][0] and self.data[i][1] < other.data[j][1]): result.set_value(self.data[i][0], self.data[i][1], self.data[i][2]) i += 1 elif self.data[i][0] == other.data[j][0] and self.data[i][1] == other.data[j][1]: result.set_value(self.data[i][0], self.data[i][1], self.data[i][2] + other.data[j][2]) i += 1 j += 1 else: result.set_value(other.data[j][0], other.data[j][1], other.data[j][2]) j += 1 while i < self.num: result.set_value(self.data[i][0], self.data[i][1], self.data[i][2]) i += 1 while j < other.num: result.set_value(other.data[j][0], other.data[j][1], other.data[j][2]) j += 1 return result A = SparseMatrix(3, 3, 2) A.set_value(0, 0, 1) A.set_value(1, 1, 2) B = SparseMatrix(3, 3, 2) B.set_value(0, 0, 2) B.set_value(1, 1, 3) # 计算 A+B C = A.add(B) # 输出结果 print("A:") for i in range(A.row): for j in range(A.col): print(A.data[i*A.col+j][2], end=" ") print() print("B:") for i in range(B.row): for j in range(B.col): print(B.data[i*B.col+j][2], end=" ") print() print("C:") for i in range(C.row): for j in range(C.col): print(C.data[i*C.col+j][2], end=" ") print()

from scipy.sparse.linalg import eigsh, LinearOperator from scipy.sparse import isspmatrix, is_pydata_spmatrix class SVDRecommender: def init(self, k=50, ncv=None, tol=0, which='LM', v0=None, maxiter=None, return_singular_vectors=True, solver='arpack'): self.k = k self.ncv = ncv self.tol = tol self.which = which self.v0 = v0 self.maxiter = maxiter self.return_singular_vectors = return_singular_vectors self.solver = solver def svds(self, A): if self.which == 'LM': largest = True elif self.which == 'SM': largest = False else: raise ValueError("which must be either 'LM' or 'SM'.") if not (isinstance(A, LinearOperator) or isspmatrix(A) or is_pydata_spmatrix(A)): A = np.asarray(A) n, m = A.shape if self.k <= 0 or self.k >= min(n, m): raise ValueError("k must be between 1 and min(A.shape), k=%d" % self.k) if isinstance(A, LinearOperator): if n > m: X_dot = A.matvec X_matmat = A.matmat XH_dot = A.rmatvec XH_mat = A.rmatmat else: X_dot = A.rmatvec X_matmat = A.rmatmat XH_dot = A.matvec XH_mat = A.matmat dtype = getattr(A, 'dtype', None) if dtype is None: dtype = A.dot(np.zeros([m, 1])).dtype else: if n > m: X_dot = X_matmat = A.dot XH_dot = XH_mat = _herm(A).dot else: XH_dot = XH_mat = A.dot X_dot = X_matmat = _herm(A).dot def matvec_XH_X(x): return XH_dot(X_dot(x)) def matmat_XH_X(x): return XH_mat(X_matmat(x)) XH_X = LinearOperator(matvec=matvec_XH_X, dtype=A.dtype, matmat=matmat_XH_X, shape=(min(A.shape), min(A.shape))) #获得隐式定义的格拉米矩阵的低秩近似。 eigvals, eigvec = eigsh(XH_X, k=self.k, tol=self.tol ** 2, maxiter=self.maxiter, ncv=self.ncv, which=self.which, v0=self.v0) #格拉米矩阵有实非负特征值。 eigvals = np.maximum(eigvals.real, 0) #使用来自pinvh的小特征值的复数检测。 t = eigvec.dtype.char.lower() factor = {'f': 1E3, 'd': 1E6} cond = factor[t] * np.finfo(t).eps cutoff = cond * np.max(eigvals) #获得一个指示哪些本征对不是简并微小的掩码, #并为阈值奇异值创建一个重新排序数组。 above_cutoff = (eigvals > cutoff) nlarge = above_cutoff.sum() nsmall = self.k - nlarge slarge = np.sqrt(eigvals[above_cutoff]) s = np.zeros_like(eigvals) s[:nlarge] = slarge if not self.return_singular_vectors: return np.sort(s) if n > m: vlarge = eigvec[:, above_cutoff] ularge = X_matmat(vlarge) / slarge if self.return_singular_vectors != 'vh' else None vhlarge = _herm(vlarge) else: ularge = eigvec[:, above_cutoff] vhlarge = _herm(X_matmat(ularge) / slarge) if self.return_singular_vectors != 'u' else None u = _augmented_orthonormal_cols(ularge, nsmall) if ularge is not None else None vh = _augmented_orthonormal_rows(vhlarge, nsmall) if vhlarge is not None else None indexes_sorted = np.argsort(s) s = s[indexes_sorted] if u is not None: u = u[:, indexes_sorted] if vh is not None: vh = vh[indexes_sorted] return u, s, vh def _augmented_orthonormal_cols(U, n): if U.shape[0] <= n: return U Q, R = np.linalg.qr(U) return Q[:, :n] def _augmented_orthonormal_rows(V, n): if V.shape[1] <= n: return V Q, R = np.linalg.qr(V.T) return Q[:, :n].T def _herm(x): return np.conjugate(x.T)这段代码在largest = False处报错了,报错信息为:Local variable 'largest' is assigned to but never used (pyfLakes E)如何改正

最新推荐

recommend-type

在keras里面实现计算f1-score的代码

5. `sparse_top_k_categorical_accuracy`: 与`top_k_categorical_accuracy`类似,但适用于稀疏情况。 这些内置的评估函数在训练过程中可以直接使用,无需自定义回调,简化了模型评估的流程。在实际应用中,根据任务...
recommend-type

matlab运用案例,用于学习

matlab运用案例,用于学习。
recommend-type

基于神经网络的流量异常检测高分项目+源码.zip

个人经导师指导并认可通过的高分项目,评审分98分。主要针对计算机相关专业和需要项目实战练习的学习者,也可作为课程设计、期末大作业。个人经导师指导并认可通过的高分项目,评审分98分。主要针对计算机相关专业和需要项目实战练习的学习者,也可作为课程设计、期末大作业。个人经导师指导并认可通过的高分项目,评审分98分。主要针对计算机相关专业和需要项目实战练习的学习者,也可作为课程设计、期末大作业。个人经导师指导并认可通过的高分项目,评审分98分。主要针对计算机相关专业和需要项目实战练习的学习者,也可作为课程设计、期末大作业。个人经导师指导并认可通过的高分项目,评审分98分。主要针对计算机相关专业和需要项目实战练习的学习者,也可作为课程设计、期末大作业。个人经导师指导并认可通过的高分项目,评审分98分。主要针对计算机相关专业和需要项目实战练习的学习者,也可作为课程设计、期末大作业。个人经导师指导并认可通过的高分项目,评审分98分。主要针对计算机相关专业和需要项目实战练习的学习者,也可作为课程设计、期末大作业。个人经导师指导并认可通过的高分项目,评审分98分。主要针对计算机相关专业和需要项目实战练习
recommend-type

使用优化算法优化变分模态分解(VMD)算法的惩罚因子(α)和分解层数(K)python源码.zip

使用优化算法,以优化VMD算法的惩罚因子惩罚因子 (α) 和分解层数 (K)。 1、将量子粒子群优化(QPSO)算法与变分模态分解(VMD)算法结合 VMD算法背景: VMD算法是一种自适应信号分解算法,主要用于分解信号为不同频率带宽的模态。 VMD的关键参数包括: 惩罚因子 α:控制带宽的限制。 分解层数 K:决定分解出的模态数。 QPSO算法背景: 量子粒子群优化(QPSO)是一种基于粒子群优化(PSO)的一种改进算法,通过量子行为模型增强全局搜索能力。 QPSO通过粒子的量子行为使其在搜索空间中不受位置限制,从而提高算法的收敛速度与全局优化能力。 任务: 使用QPSO优化VMD中的惩罚因子 α 和分解层数 K,以获得信号分解的最佳效果。 计划: 定义适应度函数:适应度函数根据VMD分解的效果来定义,通常使用重构信号的误差(例如均方误差、交叉熵等)来衡量分解的质量。 初始化QPSO粒子:定义粒子的位置和速度,表示 α 和 K 两个参数。初始化时需要在一个合理的范围内为每个粒子分配初始位置。 执行VMD分解:对每一组 α 和 K 参数,运行VMD算法分解信号。 更新QPSO粒子:使用QPSO算法更新粒子的状态,根据适应度函数调整粒子的搜索方向和位置。 迭代求解:重复QPSO的粒子更新步骤,直到满足终止条件(如适应度函数达到设定阈值,或最大迭代次数)。 输出优化结果:最终,QPSO算法会返回一个优化的 α 和 K,从而使VMD分解效果最佳。 2、将极光粒子(PLO)算法与变分模态分解(VMD)算法结合 PLO的优点与适用性 强大的全局搜索能力:PLO通过模拟极光粒子的运动,能够更高效地探索复杂的多峰优化问题,避免陷入局部最优。 鲁棒性强:PLO在面对高维、多模态问题时有较好的适应性,因此适合海上风电时间序列这种非线性、多噪声的数据。 应用场景:PLO适合用于优化VMD参数(α 和 K),并将其用于风电时间序列的预测任务。 进一步优化的建议 a. 实现更细致的PLO更新策略,优化极光粒子的运动模型。 b. 将PLO优化后的VMD应用于真实的海上风电数据,结合LSTM或XGBoost等模型进行风电功率预测。
recommend-type

JDK 17 Linux版本压缩包解压与安装指南

资源摘要信息:"JDK 17 是 Oracle 公司推出的 Java 开发工具包的第17个主要版本,它包括了Java语言和虚拟机规范的更新,以及一系列新的开发工具。这个版本是为了满足开发者对于高性能、高安全性和新特性的需求。'jdk-17_linux-x64_bin.deb.zip' 是该JDK版本的Linux 64位操作系统下的二进制文件格式,通常用于Debian或Ubuntu这样的基于Debian的Linux发行版。该文件是一个压缩包,包含了'jdk-17_linux-x64_bin.deb',这是JDK的安装包,按照Debian包管理系统的格式进行打包。通过安装这个包,用户可以在Linux系统上安装并使用JDK 17进行Java应用的开发。" ### JDK 17 特性概述 - **新特性**:JDK 17 引入了多个新特性,包括模式匹配的记录(record)、switch 表达式的改进、带有文本块的字符串处理增强等。这些新特性旨在提升开发效率和代码的可读性。 - **性能提升**:JDK 17 在性能上也有所提升,包括对即时编译器、垃圾收集器等方面的优化。 - **安全加强**:安全性一直是Java的强项,JDK 17 继续增强了安全特性,包括更多的加密算法支持和安全漏洞的修复。 - **模块化**:JDK 17 继续推动Java平台的模块化发展,模块化有助于减少Java应用程序的总体大小,并提高其安全性。 - **长期支持(LTS)**:JDK 17 是一个长期支持版本,意味着它将获得官方更长时间的技术支持和补丁更新,这对于企业级应用开发至关重要。 ### JDK 安装与使用 - **安装过程**:对于Debian或Ubuntu系统,用户可以通过下载 'jdk-17_linux-x64_bin.deb.zip' 压缩包,解压后得到 'jdk-17_linux-x64_bin.deb' 安装包。用户需要以管理员权限运行命令 `sudo dpkg -i jdk-17_linux-x64_bin.deb` 来安装JDK。 - **环境配置**:安装完成后,需要将JDK的安装路径添加到系统的环境变量中,以便在任何位置调用Java编译器和运行时环境。 - **版本管理**:为了能够管理和切换不同版本的Java,用户可能会使用如jEnv或SDKMAN!等工具来帮助切换Java版本。 ### Linux 系统中的 JDK 管理 - **包管理器**:在Linux系统中,包管理器如apt、yum、dnf等可以用来安装、更新和管理软件包,包括JDK。对于Java开发者而言,了解并熟悉这些包管理器是非常必要的。 - **Java 平台模块系统**:JDK 17 以模块化的方式组织,这意味着Java平台本身以及Java应用程序都可以被构建为一组模块。这有助于管理大型系统,使得只加载运行程序所需的模块成为可能。 ### JDK 版本选择与维护 - **版本选择**:在选择JDK版本时,除了考虑新特性、性能和安全性的需求外,企业级用户还需要考虑到JDK的版本更新周期和企业的维护策略。 - **维护策略**:对于JDK的维护,企业通常会有一个周期性的评估和升级计划,确保使用的是最新的安全补丁和性能改进。 ### JDK 17 的未来发展 - **后续版本的期待**:虽然JDK 17是一个 LTS 版本,但它不是Java版本更新的终点。Oracle 会继续推出后续版本,每六个月发布一个更新版本,每三年发布一个LTS版本。开发者需要关注未来版本中的新特性,以便适时升级开发环境。 通过以上知识点的总结,我们可以了解到JDK 17对于Java开发者的重要性以及如何在Linux系统中进行安装和使用。随着企业对于Java应用性能和安全性的要求不断提高,正确安装和维护JDK变得至关重要。同时,理解JDK的版本更新和维护策略,能够帮助开发者更好地适应和利用Java平台的持续发展。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

SQLAlchemy表级约束与触发器:数据库设计与完整性维护指南(专业性+推荐词汇)

![SQLAlchemy表级约束与触发器:数据库设计与完整性维护指南(专业性+推荐词汇)](http://www.commandprompt.com/media/images/image_ZU91fxs.width-1200.png) # 1. SQLAlchemy简介与安装 ## 简介 SQLAlchemy 是 Python 中一个强大的 SQL 工具包和对象关系映射(ORM)框架。它旨在提供数据库交互的高效、简洁和可扩展的方式。SQLAlchemy 拥有灵活的底层 API,同时提供了 ORM 层,使得开发者可以使用面向对象的方式来构建和操作数据库。 ## 安装 要开始使用 SQLA
recommend-type

jupyter_contrib_nbextensions_master下载后

Jupyter Contrib NbExtensions是一个GitHub存储库,它包含了许多可以增强Jupyter Notebook用户体验的扩展插件。当你从`master`分支下载`jupyter_contrib_nbextensions-master`文件后,你需要做以下几个步骤来安装和启用这些扩展: 1. **克隆仓库**: 先在本地环境中使用Git命令行工具(如Windows的Git Bash或Mac/Linux终端)克隆该仓库到一个合适的目录,比如: ``` git clone https://github.com/jupyter-contrib/jupyter
recommend-type

C++/Qt飞行模拟器教员控制台系统源码发布

资源摘要信息:"该资源是基于C++与Qt框架构建的飞行模拟器教员控制台系统的源码文件,可用于个人课程设计、毕业设计等多个应用场景。项目代码经过测试并确保运行成功,平均答辩评审分数为96分,具有较高的参考价值。项目适合计算机专业人员如计科、人工智能、通信工程、自动化和电子信息等相关专业的在校学生、老师或企业员工学习使用。此外,即使对编程有一定基础的人士,也可以在此代码基础上进行修改,实现新的功能或将其作为毕设、课设、作业等项目的参考。用户在下载使用时应先阅读README.md文件(如果存在),并请注意该项目仅作为学习参考,严禁用于商业用途。" 由于文件名"ori_code_vip"没有详细说明文件内容,我们不能直接从中提取出具体知识点。不过,我们可以从标题和描述中挖掘出以下知识点: 知识点详细说明: 1. C++编程语言: C++是一种通用编程语言,广泛用于软件开发领域。它支持多范式编程,包括面向对象、泛型和过程式编程。C++在系统/应用软件开发、游戏开发、实时物理模拟等方面有着广泛的应用。飞行模拟器教员控制台系统作为项目实现了一个复杂的系统,C++提供的强大功能和性能正是解决此类问题的利器。 2. Qt框架: Qt是一个跨平台的C++图形用户界面应用程序开发框架。它为开发者提供了丰富的工具和类库,用于开发具有专业外观的用户界面。Qt支持包括窗体、控件、数据处理、网络通信、多线程等功能。该框架还包含用于2D/3D图形、动画、数据库集成和国际化等高级功能的模块。利用Qt框架,开发者可以高效地构建跨平台的应用程序,如本项目中的飞行模拟器教员控制台系统。 3. 飞行模拟器系统: 飞行模拟器是一种模拟航空器(如飞机)操作的系统,广泛用于飞行员培训和飞行模拟。飞行模拟器教员控制台系统通常包括多个模块,例如飞行动力学模拟、环境模拟、虚拟仪表板、通信和导航设备模拟等。在本项目中,控制台系统允许教员控制飞行模拟器的运行,如设置天气条件、选择飞行任务、监控学员操作等。 4. 软件开发流程: 软件开发流程是将软件从概念设计到最终交付的过程。这通常包括需求分析、设计、编码、测试和维护阶段。本项目的开发过程涵盖了这些步骤,包括编写可运行的代码,并进行必要的测试以确保功能正常。这为学习软件开发流程提供了很好的实践案例。 5. 项目测试与维护: 软件开发中的测试和维护阶段是确保软件质量的关键。测试包括单元测试、集成测试和系统测试,以确保软件的每个部分都能正常工作。维护是指在软件发布后,对其进行更新和改进,以修正错误、提高性能或适应新的需求。该项目提供了测试成功的代码,为学习软件测试与维护提供了实践材料。 6. 教育与学习资源: 该资源可以作为计算机相关专业学生、教师和从业人员的教育和学习资源。对于学习进阶的初学者来说,它提供了从课程设计到毕业设计的完整项目实现参考。此外,具有一定基础的用户也可以修改项目代码,来实现个性化功能或作为其他项目的起点。 7. 许可与版权: 在使用该项目时,用户需要遵循相应的许可协议。该资源明确提示,仅供学习参考,不得用于商业用途。在软件开发和使用中,了解和遵守版权法规是非常重要的,这关系到知识产权的保护和法律风险的规避。 该资源提供了一个完整的学习案例,从项目设计、编码实现到测试验证,涵盖了软件开发的整个过程。它不仅是一个很好的学习资源,同时也是软件开发实践的一个示例。
recommend-type

"互动学习:行动中的多样性与论文攻读经历"

多样性她- 事实上SCI NCES你的时间表ECOLEDO C Tora SC和NCESPOUR l’Ingén学习互动,互动学习以行动为中心的强化学习学会互动,互动学习,以行动为中心的强化学习计算机科学博士论文于2021年9月28日在Villeneuve d'Asq公开支持马修·瑟林评审团主席法布里斯·勒菲弗尔阿维尼翁大学教授论文指导奥利维尔·皮耶昆谷歌研究教授:智囊团论文联合主任菲利普·普雷教授,大学。里尔/CRISTAL/因里亚报告员奥利维耶·西格德索邦大学报告员卢多维奇·德诺耶教授,Facebook /索邦大学审查员越南圣迈IMT Atlantic高级讲师邀请弗洛里安·斯特鲁布博士,Deepmind对于那些及时看到自己错误的人...3谢谢你首先,我要感谢我的两位博士生导师Olivier和Philippe。奥利维尔,"站在巨人的肩膀上"这句话对你来说完全有意义了。从科学上讲,你知道在这篇论文的(许多)错误中,你是我可以依