one_hot_encoding
时间: 2023-09-04 17:06:55 浏览: 152
one-hot编码
One-hot编码(one-hot encoding)是一种将分类数据转换成一组二进制向量的方法。在这个编码中,每个状态都用一个只有一个元素为1,其他元素为0的向量来表示。例如,一个15维空间中的one-hot向量可以表示为[0 0 0 0 0 1 0 0 0 0 0 0 0 0 0],其中只有第6个元素为1。该编码方法广泛应用于自然语言处理(NLP)领域等多个领域。
使用独热编码时,如果只有一个特征(feature),可以将其表示为一个独热码,即只有一个元素为1,其他元素为0的向量。例如,如果有6个状态,独热码状态编码为:000001,000010,000100,001000,010000,100000。
相比于使用二进制或格雷码来表示状态,使用one-hot编码不需要解码器来解读状态信息。因为在one-hot编码中,如果第n个位元为1,就代表机器目前处于第n个状态,无需进一步解码。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *3* [独热编码(One-Hot Encoding)介绍、代码实现应用与优缺点](https://blog.csdn.net/euffylee/article/details/114287370)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
- *2* [One-Hot Encoding(独热码)](https://blog.csdn.net/Fwuyi/article/details/123254812)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]
阅读全文