def split_dot(words): dots=[',','.','!','?'] str_data = [] for w in words: ##*****——请在下方补充代码——***** ##*****——请在上方补充代码——***** return(str_data) def get_eng_dicts(datas): w_all_dict = {} for sample in datas: for token in sample.split(" "): ##*****——请在下方补充代码——***** ##*****——请在上方补充代码——***** sort_w_list = sorted(w_all_dict.items(), key=lambda d: d[1], reverse=True) w_keys = [x for x,_ in sort_w_list[:7000-2]] w_keys.insert(0,"<PAD>") w_keys.insert(0,"<UNK>") w_dict = { x:i for i,x in enumerate(w_keys) } i_dict = { i:x for i,x in enumerate(w_keys) } return w_dict,i_dict
时间: 2024-01-17 16:12:49 浏览: 117
split_dot函数中的代码应该是:
```
if w[-1] in dots:
if len(w) == 1:
continue
str_data.append(w[:-1])
str_data.append(w[-1])
else:
str_data.append(w)
```
get_eng_dicts函数中的代码应该是:
```
if token in w_all_dict:
w_all_dict[token] += 1
else:
w_all_dict[token] = 1
```
相关问题
使用Python完善以下代码def split_dot(words): dots=[',','.','!','?'] str_data = [] for w in words: ##*****——请在下方补充代码——***** #如果句末含有四个英文标点符号中的一个,用空格隔开,如果没有则忽略。 if w in dots:
str_data.append(' ') else: str_data.append(w) return ''.join(str_data)
可以使用该函数对字符串进行处理,将句末的英文标点符号与前面的单词分开,便于后续的处理和分析。具体来说,该函数的作用是将传入的字符串 words 中,如果句末含有四个英文标点符号中的一个,用空格隔开,如果没有则忽略。例如:
```python
>>> words = "Hello, world! How are you?"
>>> split_dot(words)
'Hello, world ! How are you ? '
```
在上面的例子中,函数将字符串中的 `,` 和 `!` 和 `?` 判别为句尾标点符号,将其与前面的单词用空格隔开。
def eval_accuracy(label, pred): return np.sum(label == pred)/len(label) def draw(xy_points, t_val, b_t): if len(xy_points) != len(t_val): return u_t_val = np.unique(t_val) # draw dots for i in range(len(xy_points)): if b_t: # test data ax.scatter(xy_points[i, 0], xy_points[i, 1], s=10, marker='*', c='c') else: # train data if t_val[i] == u_t_val[0]: ax.scatter(xy_points[i, 0], xy_points[i, 1], s=10, marker='^', c='b') elif t_val[i] == u_t_val[1]: ax.scatter(xy_points[i, 0], xy_points[i, 1], s=10, marker='v', c='g') else: ax.scatter(xy_points[i, 0], xy_points[i, 1], s=10, marker='d', c='k'),这段代码的含义是什么
这段代码定义了两个函数:eval_accuracy和draw。
eval_accuracy函数的作用是计算分类器的准确率。该函数的输入参数为标签label和预测值pred,输出为分类器的准确率。
draw函数的作用是将数据点绘制在坐标系上。该函数的输入参数包括数据点xy_points、标签值t_val和一个布尔变量b_t,表示是否为测试数据。函数首先判断数据点和标签值的长度是否一致,如果不一致则返回。接着,根据标签值的不同,使用不同的标记和颜色将数据点绘制在坐标系上。如果b_t为True,则将测试数据点绘制成蓝色星号;否则,将训练数据点绘制成三角形(蓝色、绿色、黑色分别代表三个类别)。
阅读全文
相关推荐
![gz](https://img-home.csdnimg.cn/images/20210720083447.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)