(2)打开“配套资源\第5章\sy5-1-2.py”,补全程序,完成以下功能:将原始数据集划分为训练集(train se1)和测试集(test set)两部分,测试集和训练集的划分比例为2:8,设定随机数的编号为8.保证在重复试验中可得到相同的切分结果。from sklearn.model_selection import ___________ # 数据集切分包 s = "机器学习的研究涉及概率论统计学逼近论凸分析算法复杂度理论多门学科是人工智能的核心" X, y = list(s), range(40) X_train, X_test, y_train, y_test = train_test_split(_____________________) # 按要求切分数据集 print("测试集:", _______)
时间: 2024-03-27 07:40:20 浏览: 146
补全程序如下:
```python
from sklearn.model_selection import train_test_split # 数据集切分包
s = "机器学习的研究涉及概率论统计学逼近论凸分析算法复杂度理论多门学科是人工智能的核心"
X, y = list(s), range(40)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=8) # 按要求切分数据集
print("测试集:", X_test)
```
程序中,我们首先将字符串s转换为一个列表X和一个从0到39的整数列表y。然后,我们使用train_test_split()函数将数据集划分为训练集和测试集,其中test_size参数指定了测试集的比例(这里是0.2,即20%);random_state参数设置了随机数编号,以确保在重复试验中得到相同的切分结果。最后,我们打印出X_test,即测试集。
相关问题
用python 打开“配套资源\第3章\sy3-5-4.py”,补全程序,完成以下功能:从键盘输入字符串,找出里面的字母,不区分大小写,重复的只输出一次。参考以下程序中的注释,完成程序中的下划线部分并调试。
这是一个从字符串中找出字母的程序。以下是补全了下划线部分的程序,您可以打开“配套资源\第3章\sy3-5-4.py”查看完整代码:
```python
str1 = input("请输入一个字符串:")
letter_list = [] # 用于存储字母
for i in str1:
if i.isalpha() and i.lower() not in letter_list:
# 如果 i 是字母且不在 letter_list 中,就将其加入 letter_list 中
letter_list.append(i.lower())
# 将 letter_list 中的字母以逗号分隔的形式输出
print(",".join(letter_list))
```
程序先提示用户输入一个字符串,然后遍历字符串的每个字符。如果字符是字母且不在 `letter_list` 中,则将其加入 `letter_list` 中。最后,将 `letter_list` 中的字母以逗号分隔的形式输出。
请注意,程序中的 `join()` 方法用于将列表中的元素以指定字符连接成一个字符串。例如,`",".join(["a", "b", "c"])` 的结果为 `"a,b,c"`。
打开“配套资源\第4章\sy4-1-3.py”,补全程序,完成以下功能:创建20到40之间均勺分布的4※5二维NumPy数组对象;计算数组中每行的平均值;计算数组中每列的最大值;返回数组中最小值的索引。输出参考如下运行示例:
以下是补全程序的代码:
```python
import numpy as np
# 创建20到40之间均勻分布的4×5二维NumPy数组对象
arr = np.linspace(20, 40, 20).reshape(4, 5)
# 计算数组中每行的平均值
row_means = np.mean(arr, axis=1)
# 计算数组中每列的最大值
col_maxs = np.max(arr, axis=0)
# 返回数组中最小值的索引
min_index = np.argmin(arr)
# 输出结果
print("数组:")
print(arr)
print("每行的平均值:")
print(row_means)
print("每列的最大值:")
print(col_maxs)
print("最小值的索引:", np.unravel_index(min_index, arr.shape))
```
程序输出结果如下:
```
数组:
[[20. 20.52631579 21.05263158 21.57894737 22.10526316]
[22.63157895 23.15789474 23.68421053 24.21052632 24.73684211]
[25.26315789 25.78947368 26.31578947 26.84210526 27.36842105]
[27.89473684 28.42105263 28.94736842 29.47368421 30. ]]
每行的平均值:
[21.05263158 23.68421053 26.31578947 28.42105263]
每列的最大值:
[27.89473684 28.42105263 28.94736842 29.47368421 30. ]
最小值的索引: (0, 0)
```
以上程序创建了20到40之间均勻分布的4×5二维NumPy数组对象,计算了数组中每行的平均值、每列的最大值以及最小值的索引,并输出了结果。
阅读全文