检查代码:import numpy as np import matplotlib.pyplot as plt # 船的参数 length = 10 # 长度(m) width = 1 # 宽度(m) mass = 10 * 1000 # 质量(kg) area = length * width # 参考面积(m^2) # 阻力系数 rho = 1.2 # 空气密度(kg/m^3) Cd = 1.1 # 摩擦系数 k = 0.5 * rho * Cd * area # 时间步长 dt = 0.1 # 秒 # 初始速度 vs = np.linspace(0, 10, 101) # 0~10之间等间距取101个数 # 计算每个初始速度对应的船运动距离 ss = [] for v in vs: t = 0 s = 0 while True: # 计算阻力 F = k * v**2 # 计算加速度 a = -F / mass # 更新速度和位置 v += a * dt s += v * dt t += dt if v <= 0: # 船静止时退出循环 break ss.append(s) # 画图 plt.plot(vs, ss) plt.xlabel('Initial velocity (m/s)') plt.ylabel('Distance traveled (m)') plt.title('Distance vs. initial velocity') plt.show()

时间: 2024-02-14 17:09:55 浏览: 538
这段代码看起来没有明显的问题,但需要注意一些细节: 1. 导入模块时,最好按照约定俗成的顺序,先导入 Python 内置模块,然后是第三方模块,最后才是自定义模块。 2. 变量名应该有意义,尽量避免使用单个字母作为变量名。 3. 可以考虑将逻辑分离成多个函数,使代码更加模块化和可读性更好。 4. 在循环中使用 break 语句时,需要特别小心,确保不会陷入死循环。 5. 在画图时,可以添加 legend() 函数来显示图例,使图形更加清晰易懂。 除此之外,这段代码可以正常运行并且输出符合预期的结果。
相关问题

import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import load_iris from sklearn.linear_model import LinearRegression %matplotlib inline iris = load_iris() data = pd.DataFrame(iris.data) data.columns = ['sepal - length','sepal - width','petal - length','petal - width'] data.head(11)

这段代码首先导入了 pandas、numpy、matplotlib.pyplot、sklearn.datasets 和 sklearn.linear_model 等库。然后使用 load_iris 函数加载鸢尾花数据集,将数据集中的样本特征存储在一个名为 iris 的变量中。接着,用 pandas 库中的 DataFrame 类来创建一个数据框,数据框中的数据是 iris.data。然后,将每列的名称更改为 'sepal - length'、'sepal - width'、'petal - length' 和 'petal - width'。最后,使用 data.head(11) 显示数据框中前11行数据,以便对数据进行初步观察和分析。

设计并实现带线性刻度标记的正弦函数或余弦函数组图 线性刻度标记。 部分参考程序如下 import numpy as np import matplotlib.pyplot as plt # 定义要绘制的标记列表 cases = [ None, 8, (30, 8), [16, 24, 32], [0, -1], slice(100, 200, 3), 0.1, 0.4, (0.2, 0.4) ] # data points delta = 0.11 x = np.linspace(0, 10 - 2 * delta, 200) + delta y = np.sin(x) + 1.0 + delta续写代码9幅小图组成一幅图

以下是实现带线性刻度标记的正弦函数或余弦函数组图的代码: ```python import numpy as np import matplotlib.pyplot as plt # 定义要绘制的标记列表 cases = [ None, 8, (30, 8), [16, 24, 32], [0, -1], slice(100, 200, 3), 0.1, 0.4, (0.2, 0.4) ] # data points delta = 0.11 x = np.linspace(0, 10 - 2 * delta, 200) + delta y_sin = np.sin(x) + 1.0 + delta y_cos = np.cos(x) + 1.0 + delta # 创建子图 fig, axs = plt.subplots(nrows=3, ncols=3, figsize=(10, 8)) # 绘制每幅图 for i, ax in enumerate(axs.flatten()): ax.plot(x, y_sin if i < 5 else y_cos, marker='o', markersize=4) ax.set_title(f'Case {i+1}') ax.set_xlim([0, 10]) ax.set_ylim([0, 2.2]) ax.set_xticks(np.arange(0, 11, 2)) ax.set_yticks(np.arange(0, 2.3, 0.5)) ax.grid(True) if cases[i]: ax.xaxis.set_tick_params(length=10, width=2, direction='in', labelsize='large', labelcolor='red', labelrotation=45) ax.yaxis.set_tick_params(length=10, width=2, direction='in', labelsize='large', labelcolor='blue', labelrotation=45) ax.xaxis.set_tick_params(which='minor', length=5, width=1, direction='in', labelsize='medium', labelcolor='red', labelrotation=45) ax.yaxis.set_tick_params(which='minor', length=5, width=1, direction='in', labelsize='medium', labelcolor='blue', labelrotation=45) ax.tick_params(axis='both', pad=10) ax.tick_params(which='both', top=True, right=True) ax.tick_params(which='major', length=10, width=2) ax.tick_params(which='minor', length=5, width=1) # 调整子图布局 plt.tight_layout() # 显示图像 plt.show() ``` 运行上述代码可以得到一个由9幅小图组成的图像,每幅图均为带线性刻度标记的正弦函数或余弦函数。其中,每幅图都有一个唯一的标记列表,展示了如何在坐标轴上添加线性刻度标记。
阅读全文

相关推荐

import random import numpy as np import matplotlib.pyplot as plt 生成随机坐标点 def generate_points(num_points): points = [] for i in range(num_points): x = random.uniform(-10, 10) y = random.uniform(-10, 10) points.append([x, y]) return points 计算欧几里得距离 def euclidean_distance(point1, point2): return np.sqrt(np.sum(np.square(np.array(point1) - np.array(point2)))) K-means算法实现 def kmeans(points, k, num_iterations=100): num_points = len(points) # 随机选择k个点作为初始聚类中心 centroids = random.sample(points, k) # 初始化聚类标签和距离 labels = np.zeros(num_points) distances = np.zeros((num_points, k)) for i in range(num_iterations): # 计算每个点到每个聚类中心的距离 for j in range(num_points): for l in range(k): distances[j][l] = euclidean_distance(points[j], centroids[l]) # 根据距离将点分配到最近的聚类中心 for j in range(num_points): labels[j] = np.argmin(distances[j]) # 更新聚类中心 for l in range(k): centroids[l] = np.mean([points[j] for j in range(num_points) if labels[j] == l], axis=0) return labels, centroids 生成坐标点 points = generate_points(100) 对点进行K-means聚类 k_values = [2, 3, 4] for k in k_values: labels, centroids = kmeans(points, k) # 绘制聚类结果 colors = [‘r’, ‘g’, ‘b’, ‘y’, ‘c’, ‘m’] for i in range(k): plt.scatter([points[j][0] for j in range(len(points)) if labels[j] == i], [points[j][1] for j in range(len(points)) if labels[j] == i], color=colors[i]) plt.scatter([centroid[0] for centroid in centroids], [centroid[1] for centroid in centroids], marker=‘x’, color=‘k’, s=100) plt.title(‘K-means clustering with k={}’.format(k)) plt.show()import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.cluster import KMeans from sklearn.datasets import load_iris 载入数据集 iris = load_iris() X = iris.data y = iris.target K-means聚类 kmeans = KMeans(n_clusters=3, random_state=0).fit(X) 可视化结果 plt.scatter(X[:, 0], X[:, 1], c=kmeans.labels_) plt.xlabel(‘Sepal length’) plt.ylabel(‘Sepal width’) plt.title(‘K-means clustering on iris dataset’) plt.show()从聚类算法的评价指标对结果进行分析

分析以下代码#!/usr/bin/python # -*- coding:utf-8 -*- import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt from sklearn import svm from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 'sepal length', 'sepal width', 'petal length', 'petal width' iris_feature = u'花萼长度', u'花萼宽度', u'花瓣长度', u'花瓣宽度' if __name__ == "__main__": path = 'D:\\iris.data' # 数据文件路径 data = pd.read_csv(path, header=None) x, y = data[range(4)], data[4] y = pd.Categorical(y).codes x = x[[0, 1]] x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=1, train_size=0.6) # 分类器 clf = svm.SVC(C=0.1, kernel='linear', decision_function_shape='ovr') # clf = svm.SVC(C=0.8, kernel='rbf', gamma=20, decision_function_shape='ovr') clf.fit(x_train, y_train.ravel()) # 准确率 print (clf.score(x_train, y_train)) # 精度 print ('训练集准确率:', accuracy_score(y_train, clf.predict(x_train))) print (clf.score(x_test, y_test)) print ('测试集准确率:', accuracy_score(y_test, clf.predict(x_test))) # decision_function print ('decision_function:\n', clf.decision_function(x_train)) print ('\npredict:\n', clf.predict(x_train)) # 画图 x1_min, x2_min = x.min() x1_max, x2_max = x.max() x1, x2 = np.mgrid[x1_min:x1_max:500j, x2_min:x2_max:500j] # 生成网格采样点 grid_test = np.stack((x1.flat, x2.flat), axis=1) # 测试点 # print 'grid_test = \n', grid_test # Z = clf.decision_function(grid_test) # 样本到决策面的距离 # print Z grid_hat = clf.predict(grid_test) # 预测分类值 grid_hat = grid_hat.reshape(x1.shape) # 使之与输入的形状相同 mpl.rcParams['font.sans-serif'] = [u'SimHei'] mpl.rcParams['axes.unicode_minus'] = False cm_light = mpl.colors.ListedColormap(['#A0FFA0', '#FFA0A0', '#A0A0FF']) cm_dark = mpl.colors.ListedColormap(['g', 'r', 'b']) plt.figure(facecolor='w') plt.pcolormesh(x1, x2, grid_hat, shading='auto', cmap=cm_light) plt.scatter(x[0], x[1], c=y, edgecolors='k', s=50, cmap=cm_dark) # 样本 plt.scatter(x_test[0], x_test[1], s=120, facecolors='none', zorder=10) # 圈中测试集样本 plt.xlabel(iris_feature[0], fontsize=13) plt.ylabel(iris_feature[1], fontsize=13) plt.xlim(x1_min, x1_max) plt.ylim(x2_min, x2_max) plt.title(u'鸢尾花SVM二特征分类', fontsize=16) plt.grid(b=True, ls=':') plt.tight_layout(pad=1.5) plt.show()

import matplotlib.pyplot as plt import numpy as np from matplotlib.colors import ListedColormap from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier iris = datasets.load_iris() X = iris.data[:, [2, 3]] y = iris.target print('Class labels:', np.unique(y)) def plot_decision_regions(X, y, classifier, test_idx=None, resolution=0.02): # setup marker generator and color map markers = ('s', 'x', 'o', '^', 'v') colors = ('red', 'blue', 'lightgreen', 'gray', 'cyan') cmap = ListedColormap(colors[:len(np.unique(y))]) # plot the decision surface x1_min, x1_max = X[:, 0].min() - 1, X[:, 0].max() + 1 x2_min, x2_max = X[:, 1].min() - 1, X[:, 1].max() + 1 xx1, xx2 = np.meshgrid(np.arange(x1_min, x1_max, resolution), np.arange(x2_min, x2_max, resolution)) Z = classifier.predict(np.array([xx1.ravel(), xx2.ravel()]).T) Z = Z.reshape(xx1.shape) plt.contourf(xx1, xx2, Z, alpha=0.3, cmap=cmap) plt.xlim(xx1.min(), xx1.max()) plt.ylim(xx2.min(), xx2.max()) for idx, cl in enumerate(np.unique(y)): plt.scatter(x=X[y == cl, 0], y=X[y == cl, 1], alpha=0.8, c=colors[idx], marker=markers[idx], label=cl, edgecolor='black') if test_idx: # plot all samples X_test, y_test = X[test_idx, :], y[test_idx] plt.scatter(X_test[:, 0], X_test[:, 1], c='y', edgecolor='black', alpha=1.0, linewidth=1, marker='o', s=100, label='test set') forest = RandomForestClassifier(criterion='gini', n_estimators=20,#叠加20决策树 random_state=1, n_jobs=4)#多少随机数进行运算 forest.fit(X_train, y_train) plot_decision_regions(X_combined, y_combined, classifier=forest, test_idx=range(105, 150)) plt.xlabel('petal length [cm]') plt.ylabel('petal width [cm]') plt.legend(loc='upper left') plt.tight_layout() #plt.savefig('images/03_22.png', dpi=300) plt.show()

最新推荐

recommend-type

(完整数据)全国各地级市分类异质性数据2024年

## 数据指标说明 地域范围:298个地级市(其中包括4个直辖市) 更新时间:2024年 数据来源:文件里面有说明 指数包括: (1)南北方城市 (2)东中西城市 (3)七大地理区、八大综合经济区 (4)城市群,长三角珠三角京津冀等 (5)长江流域沿岸、黄河流域沿岸 (6)35个大中城市、70个大中城市 (7)沿海城市: (8)胡焕庸线 (9)环境重点保护城市 参考文献: 赵涛,张智,梁上坤.数字经济、创业活跃度与高质量发展——来自中国城市的经验证据[J].管理世界,2020,36(10):65-76. 胡求光,周宇飞.开发区产业集聚的环境效应:加剧污染还是促进治理?[J].中国人口·资源与环境,2020,30(10):64-72. 蒋仁爱,杨圣豪,温军.高铁开通与经济高质量发展——机制及效果[J].南开经济研究,2023(07):70-89.
recommend-type

GPU RDMA上游支持进展及动态内存缓冲区机制

内容概要:本文详细介绍了 GPU 上游 RDMA 支持的最新进展,重点讨论了使用 dma-buf 作为共享内存机制的关键技术细节和设计变更。文章还展示了目前的工作状态,未来的发展方向以及软件生态系统的启用。核心内容包括动态内存缓冲区机制的实现方法及其与 GPU 和 NIC 驱动程序的交互方式。 适合人群:从事高性能计算和分布式系统研究的技术人员,尤其是对 GPU 和 RDMA 技术感兴趣的开发者。 使用场景及目标:帮助研究人员和开发者了解并实施 GPU-RDMA 解决方案,提升系统性能。具体应用场景包括数据中心内的高效数据传输和大规模并行计算任务的优化。 其他说明:文中提供了详细的代码审查和技术设计的背景,有助于深入理解相关技术的内部运作机制。此外,文章还提到了当前的一些挑战和未来的改进方向,为后续的研究提供指导。
recommend-type

深入理解Java回调函数及其应用实例

内容概要:本文详细介绍了回调函数的概念、分类和特点。通过具体实例展示了同步和异步回调函数在Java程序中的应用场景,如事件处理、多线程操作和第三方库的集成。同时阐述了如何利用接口和Java 8的Lambda表达式实现高效的回调机制。 适合人群:具有初级及以上Java编程经验的开发者,尤其是希望深入了解回调函数工作机制的人群。 使用场景及目标:帮助读者掌握同步和异步回调函数的区别及应用场景,提高程序的响应速度和效率。在日常开发中能够灵活运用回调函数解决实际问题。 其他说明:回调函数广泛应用于多种开发框架和技术中,熟练掌握回调函数有助于提升编程技巧和软件架构能力。
recommend-type

基于java的理发店会员管理系统设计与实现e.docx

基于java的理发店会员管理系统设计与实现e.docx
recommend-type

Raspberry Pi OpenCL驱动程序安装与QEMU仿真指南

资源摘要信息:"RaspberryPi-OpenCL驱动程序" 知识点一:Raspberry Pi与OpenCL Raspberry Pi是一系列低成本、高能力的单板计算机,由Raspberry Pi基金会开发。这些单板计算机通常用于教育、电子原型设计和家用服务器。而OpenCL(Open Computing Language)是一种用于编写程序,这些程序可以在不同种类的处理器(包括CPU、GPU和其他处理器)上执行的标准。OpenCL驱动程序是为Raspberry Pi上的应用程序提供支持,使其能够充分利用板载硬件加速功能,进行并行计算。 知识点二:调整Raspberry Pi映像大小 在准备Raspberry Pi的操作系统映像以便在QEMU仿真器中使用时,我们经常需要调整映像的大小以适应仿真环境或为了确保未来可以进行系统升级而留出足够的空间。这涉及到使用工具来扩展映像文件,以增加可用的磁盘空间。在描述中提到的命令包括使用`qemu-img`工具来扩展映像文件`2021-01-11-raspios-buster-armhf-lite.img`的大小。 知识点三:使用QEMU进行仿真 QEMU是一个通用的开源机器模拟器和虚拟化器,它能够在一台计算机上模拟另一台计算机。它可以运行在不同的操作系统上,并且能够模拟多种不同的硬件设备。在Raspberry Pi的上下文中,QEMU能够被用来模拟Raspberry Pi硬件,允许开发者在没有实际硬件的情况下测试软件。描述中给出了安装QEMU的命令行指令,并建议更新系统软件包后安装QEMU。 知识点四:管理磁盘分区 描述中提到了使用`fdisk`命令来检查磁盘分区,这是Linux系统中用于查看和修改磁盘分区表的工具。在进行映像调整大小的过程中,了解当前的磁盘分区状态是十分重要的,以确保不会对现有的数据造成损害。在确定需要增加映像大小后,通过指定的参数可以将映像文件的大小增加6GB。 知识点五:Raspbian Pi OS映像 Raspbian是Raspberry Pi的官方推荐操作系统,是一个为Raspberry Pi量身打造的基于Debian的Linux发行版。Raspbian Pi OS映像文件是指定的、压缩过的文件,包含了操作系统的所有数据。通过下载最新的Raspbian Pi OS映像文件,可以确保你拥有最新的软件包和功能。下载地址被提供在描述中,以便用户可以获取最新映像。 知识点六:内核提取 描述中提到了从仓库中获取Raspberry-Pi Linux内核并将其提取到一个文件夹中。这意味着为了在QEMU中模拟Raspberry Pi环境,可能需要替换或更新操作系统映像中的内核部分。内核是操作系统的核心部分,负责管理硬件资源和系统进程。提取内核通常涉及到解压缩下载的映像文件,并可能需要重命名相关文件夹以确保与Raspberry Pi的兼容性。 总结: 描述中提供的信息详细说明了如何通过调整Raspberry Pi操作系统映像的大小,安装QEMU仿真器,获取Raspbian Pi OS映像,以及处理磁盘分区和内核提取来准备Raspberry Pi的仿真环境。这些步骤对于IT专业人士来说,是在虚拟环境中测试Raspberry Pi应用程序或驱动程序的关键步骤,特别是在开发OpenCL应用程序时,对硬件资源的配置和管理要求较高。通过理解上述知识点,开发者可以更好地利用Raspberry Pi的并行计算能力,进行高性能计算任务的仿真和测试。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

Fluent UDF实战攻略:案例分析与高效代码编写

![Fluent UDF实战攻略:案例分析与高效代码编写](https://databricks.com/wp-content/uploads/2021/10/sql-udf-blog-og-1024x538.png) 参考资源链接:[fluent UDF中文帮助文档](https://wenku.csdn.net/doc/6401abdccce7214c316e9c28?spm=1055.2635.3001.10343) # 1. Fluent UDF基础与应用概览 流体动力学仿真软件Fluent在工程领域被广泛应用于流体流动和热传递问题的模拟。Fluent UDF(User-Defin
recommend-type

如何使用DPDK技术在云数据中心中实现高效率的流量监控与网络安全分析?

在云数据中心领域,随着服务的多样化和用户需求的增长,传统的网络监控和分析方法已经无法满足日益复杂的网络环境。DPDK技术的引入,为解决这一挑战提供了可能。DPDK是一种高性能的数据平面开发套件,旨在优化数据包处理速度,降低延迟,并提高网络吞吐量。具体到实现高效率的流量监控与网络安全分析,可以遵循以下几个关键步骤: 参考资源链接:[DPDK峰会:云数据中心安全实践 - 流量监控与分析](https://wenku.csdn.net/doc/1bq8jittzn?spm=1055.2569.3001.10343) 首先,需要了解DPDK的基本架构和工作原理,特别是它如何通过用户空间驱动程序和大
recommend-type

Apache RocketMQ Go客户端:全面支持与消息处理功能

资源摘要信息:"rocketmq-client-go:Apache RocketMQ Go客户端" Apache RocketMQ Go客户端是专为Go语言开发的RocketMQ客户端库,它几乎涵盖了Apache RocketMQ的所有核心功能,允许Go语言开发者在Go项目中便捷地实现消息的发布与订阅、访问控制列表(ACL)权限管理、消息跟踪等高级特性。该客户端库的设计旨在提供一种简单、高效的方式来与RocketMQ服务进行交互。 核心知识点如下: 1. 发布与订阅消息:RocketMQ Go客户端支持多种消息发送模式,包括同步模式、异步模式和单向发送模式。同步模式允许生产者在发送消息后等待响应,确保消息成功到达。异步模式适用于对响应时间要求不严格的场景,生产者在发送消息时不会阻塞,而是通过回调函数来处理响应。单向发送模式则是最简单的发送方式,只负责将消息发送出去而不关心是否到达,适用于对消息送达不敏感的场景。 2. 发送有条理的消息:在某些业务场景中,需要保证消息的顺序性,比如订单处理。RocketMQ Go客户端提供了按顺序发送消息的能力,确保消息按照发送顺序被消费者消费。 3. 消费消息的推送模型:消费者可以设置为使用推送模型,即消息服务器主动将消息推送给消费者,这种方式可以减少消费者轮询消息的开销,提高消息处理的实时性。 4. 消息跟踪:对于生产环境中的消息传递,了解消息的完整传递路径是非常必要的。RocketMQ Go客户端提供了消息跟踪功能,可以追踪消息从发布到最终消费的完整过程,便于问题的追踪和诊断。 5. 生产者和消费者的ACL:访问控制列表(ACL)是一种权限管理方式,RocketMQ Go客户端支持对生产者和消费者的访问权限进行细粒度控制,以满足企业对数据安全的需求。 6. 如何使用:RocketMQ Go客户端提供了详细的使用文档,新手可以通过分步说明快速上手。而有经验的开发者也可以根据文档深入了解其高级特性。 7. 社区支持:Apache RocketMQ是一个开源项目,拥有活跃的社区支持。无论是使用过程中遇到问题还是想要贡献代码,都可以通过邮件列表与社区其他成员交流。 8. 快速入门:为了帮助新用户快速开始使用RocketMQ Go客户端,官方提供了快速入门指南,其中包含如何设置rocketmq代理和名称服务器等基础知识。 在安装和配置方面,用户通常需要首先访问RocketMQ的官方网站或其在GitHub上的仓库页面,下载最新版本的rocketmq-client-go包,然后在Go项目中引入并初始化客户端。配置过程中可能需要指定RocketMQ服务器的地址和端口,以及设置相应的命名空间或主题等。 对于实际开发中的使用,RocketMQ Go客户端的API设计注重简洁性和直观性,使得Go开发者能够很容易地理解和使用,而不需要深入了解RocketMQ的内部实现细节。但是,对于有特殊需求的用户,Apache RocketMQ社区文档和代码库中提供了大量的参考信息和示例代码,可以用于解决复杂的业务场景。 由于RocketMQ的版本迭代,不同版本的RocketMQ Go客户端可能会引入新的特性和对已有功能的改进。因此,用户在使用过程中应该关注官方发布的版本更新日志,以确保能够使用到最新的特性和性能优化。对于版本2.0.0的特定特性,文档中提到的以同步模式、异步模式和单向方式发送消息,以及消息排序、消息跟踪、ACL等功能,是该版本客户端的核心优势,用户可以根据自己的业务需求进行选择和使用。 总之,rocketmq-client-go作为Apache RocketMQ的Go语言客户端,以其全面的功能支持、简洁的API设计、活跃的社区支持和详尽的文档资料,成为Go开发者在构建分布式应用和消息驱动架构时的得力工具。
recommend-type

"互动学习:行动中的多样性与论文攻读经历"

多样性她- 事实上SCI NCES你的时间表ECOLEDO C Tora SC和NCESPOUR l’Ingén学习互动,互动学习以行动为中心的强化学习学会互动,互动学习,以行动为中心的强化学习计算机科学博士论文于2021年9月28日在Villeneuve d'Asq公开支持马修·瑟林评审团主席法布里斯·勒菲弗尔阿维尼翁大学教授论文指导奥利维尔·皮耶昆谷歌研究教授:智囊团论文联合主任菲利普·普雷教授,大学。里尔/CRISTAL/因里亚报告员奥利维耶·西格德索邦大学报告员卢多维奇·德诺耶教授,Facebook /索邦大学审查员越南圣迈IMT Atlantic高级讲师邀请弗洛里安·斯特鲁布博士,Deepmind对于那些及时看到自己错误的人...3谢谢你首先,我要感谢我的两位博士生导师Olivier和Philippe。奥利维尔,"站在巨人的肩膀上"这句话对你来说完全有意义了。从科学上讲,你知道在这篇论文的(许多)错误中,你是我可以依