b sys_read 什么意思

`sys_read` 是 Linux 操作系统中的一个系统调用，用于从文件描述符中读取数据。`sys_read` 的函数原型如下： ```c #include <unistd.h> ssize_t sys_read(unsigned int fd, char *buf, size_t count); ``` 其中，`fd` 参数是要读取的文件描述符，`buf` 参数是存储读取数据的缓冲区，`count` 参数是要读取的字节数。`sys_read` 函数返回实际读取的字节数，如果返回值为 0，则表示已经读取到文件末尾，如果返回值为 -1，则表示读取失败。

import sys import re import jieba import codecs import gensim import numpy as np import pandas as pd def segment(doc: str): stop_words = pd.read_csv('data/stopwords.txt', index_col=False, quoting=3, names=['stopword'], sep='\n', encoding='utf-8') stop_words = list(stop_words.stopword) reg_html = re.compile(r'<[^>]+>', re.S) # 去掉html标签数字等 doc = reg_html.sub('', doc) doc = re.sub('[０-９]', '', doc) doc = re.sub('\s', '', doc) word_list = list(jieba.cut(doc)) out_str = '' for word in word_list: if word not in stop_words: out_str += word out_str += ' ' segments = out_str.split(sep=' ') return segments def doc2vec(file_name, model): start_alpha = 0.01 infer_epoch = 1000 doc = segment(codecs.open(file_name, 'r', 'utf-8').read()) vector = model.docvecs[doc_id] return model.infer_vector(doc) # 计算两个向量余弦值 def similarity(a_vect, b_vect): dot_val = 0.0 a_norm = 0.0 b_norm = 0.0 cos = None for a, b in zip(a_vect, b_vect): dot_val += a * b a_norm += a 2 b_norm += b 2 if a_norm == 0.0 or b_norm == 0.0: cos = -1 else: cos = dot_val / ((a_norm * b_norm) ** 0.5) return cos def test_model(file1, file2): print('导入模型') model_path = 'tmp/zhwk_news.doc2vec' model = gensim.models.Doc2Vec.load(model_path) vect1 = doc2vec(file1, model) # 转成句子向量 vect2 = doc2vec(file2, model) print(sys.getsizeof(vect1)) # 查看变量占用空间大小 print(sys.getsizeof(vect2)) cos = similarity(vect1, vect2) print('相似度：%0.2f%%' % (cos * 100)) if name == 'main': file1 = 'data/corpus_test/t1.txt' file2 = 'data/corpus_test/t2.txt' test_model(file1, file2) 有什么问题，怎么解决

在 `doc2vec()` 函数中，你在尝试访问 `doc_id` 变量，但是该变量未定义，这会导致 `NameError` 错误。你需要将该变量定义为函数的参数，并在调用函数时传递文档的标识符。另外，在 `doc2vec()` 函数中，你在尝试将 `Doc2Vec` 模型返回的向量赋值给 `vector` 变量，但是该变量没有使用，这会导致不必要的计算和内存占用。你应该直接返回模型返回的向量。最后，在 `test_model()` 函数中，你在尝试打印向量的内存占用大小，但是你应该打印向量本身的大小，而不是指向向量的变量的大小。你可以使用 `np.ndarray.nbytes` 属性来获取向量的大小。下面是修改后的代码： ``` import sys import re import jieba import codecs import gensim import numpy as np import pandas as pd def segment(doc: str): stop_words = pd.read_csv('data/stopwords.txt', index_col=False, quoting=3, names=['stopword'], sep='\n', encoding='utf-8') stop_words = list(stop_words.stopword) reg_html = re.compile(r'<[^>]+>', re.S) # 去掉html标签数字等 doc = reg_html.sub('', doc) doc = re.sub('[０-９]', '', doc) doc = re.sub('\s', '', doc) word_list = list(jieba.cut(doc)) out_str = '' for word in word_list: if word not in stop_words: out_str += word out_str += ' ' segments = out_str.split(sep=' ') return segments def doc2vec(file_name, model, doc_id): start_alpha = 0.01 infer_epoch = 1000 doc = segment(codecs.open(file_name, 'r', 'utf-8').read()) return model.infer_vector(doc, alpha=start_alpha, steps=infer_epoch) # 计算两个向量余弦值 def similarity(a_vect, b_vect): dot_val = 0.0 a_norm = 0.0 b_norm = 0.0 cos = None for a, b in zip(a_vect, b_vect): dot_val += a * b a_norm += a ** 2 b_norm += b ** 2 if a_norm == 0.0 or b_norm == 0.0: cos = -1 else: cos = dot_val / ((a_norm * b_norm) ** 0.5) return cos def test_model(file1, file2): print('导入模型') model_path = 'tmp/zhwk_news.doc2vec' model = gensim.models.Doc2Vec.load(model_path) vect1 = doc2vec(file1, model, doc_id=0) # 转成句子向量 vect2 = doc2vec(file2, model, doc_id=1) print(vect1.nbytes) # 查看向量大小 print(vect2.nbytes) cos = similarity(vect1, vect2) print('相似度：%0.2f%%' % (cos * 100)) if __name__ == '__main__': file1 = 'data/corpus_test/t1.txt' file2 = 'data/corpus_test/t2.txt' test_model(file1, file2) ```

def decrypt(self): key = ''.encode('utf8') iv = b'' mode = AES.MODE_CBC cryptos = AES.new(key, mode, iv=iv) try: with open(' ', 'rb') as file: decrypted_data = file.read() decrypted_content_memory = io.BytesIO(cryptos.decrypt(a2b_hex(decrypted_data))) except Exception as e: print(e) sys.exit(0) return decrypted_content_memory怎么把e打印为红色

你可以使用ANSI转义序列来将打印输出的文本着色，从而将异常信息以红色显示。在许多终端中，可以使用ANSI转义序列来设置文本的颜色和样式。以下是如何将异常信息打印为红色的示例代码： ``` import io import sys from Crypto.Cipher import AES class Decryptor: def decrypt(self): key = ''.encode('utf8') iv = b'' mode = AES.MODE_CBC cryptos = AES.new(key, mode, iv=iv) try: with open(' ', 'rb') as file: decrypted_data = file.read() decrypted_content_memory = io.BytesIO(cryptos.decrypt(a2b_hex(decrypted_data))) except Exception as e: print('\033[91m' + str(e) + '\033[0m') # 将异常信息以红色显示 sys.exit(0) return decrypted_content_memory ``` 在这个示例中，我们使用ANSI转义序列`\033[91m`来将输出的文本颜色设置为红色，使用`\033[0m`将其重置为默认颜色。

b sys_read 什么意思

相关推荐

uhdd.sys源码

硬盘基本参数表-Read.pdf

b_010_2_IPC-Socket-Ashmen-S.zip

解释 snmp-agent snmp-agent local-engineid 800063A280148477796B8B00000001 snmp-agent community write private snmp-agent community read public snmp-agent sys-info version all

epoll 监听串口有数据后 read 卡死

写linux的read函数串口答应CAN通信数据的代码

最新推荐

段码lcd驱动_ht1621中文资料.pdf

Linux动态启用/禁用超线程技术的方法详解

服务器虚拟化部署方案.doc

北京市东城区人民法院服务器项目.doc

求集合数据的均方差iction-mast开发笔记

VMP技术解析：Handle块优化与壳模板初始化

管理建模和仿真的文件

【进阶】音频处理基础：使用Librosa

python中字典转换成json

C++ Primer 第四版更新：现代编程风格与标准库