没有合适的资源?快使用搜索试试~ 我知道了~
首页遗传算法在中药药对挖掘中的应用——设计与实现
"基于遗传算法的中药药对挖掘系统的设计与实现" 是一篇关于利用数据挖掘技术探索中药方剂配伍规律的毕业设计论文。作者分析了关联规则在中药研究中的局限性,提出并实现了双向关联规则的概念,以增强规则发现的全面性和准确性。论文深入探讨了遗传算法的基础,阐述了其在数据挖掘中的应用潜力,特别是在解决复杂优化问题时的高效性。 在系统设计部分,作者将中药方剂库转化为位图矩阵,这一转化极大地提高了在大量数据中搜索有效药对的效率。通过位图矩阵,可以更直观地表示方剂之间的关系,便于遗传算法的操作。论文详细描述了系统实现的各个步骤,包括个体的编码方法(如何将中药药对转化为遗传算法可处理的形式),适应度函数的设计(用于评估药对组合的有效性),以及遗传操作的实现,如选择、交叉和变异,这些操作是遗传算法进化过程的核心。 测试阶段,论文选取了脾胃类方剂库作为样本,通过实际运行和分析结果,验证了该系统能迅速找到具有显著临床意义的中药药对,对于中医药理论的深入研究和临床实践有积极的推动作用。关键词聚焦于数据挖掘、置信度(衡量规则可靠性的指标)、双向关联规则和遗传算法,突显了研究的核心技术和应用领域。 这篇论文不仅提出了改进传统关联规则的新思路,还成功地结合遗传算法开发出了一套实用的中药药对挖掘系统,为中医药的科学研究提供了一种新的工具和方法。通过这种技术,可以更有效地挖掘中药方剂的内在联系,为中医药的现代化和国际化提供了有力的技术支持。
资源详情
资源推荐
![](https://csdnimg.cn/release/download_crawler_static/87795701/bg5.jpg)
第 2 页 共 24 页
多时候人们感兴趣的是“相互依赖”的规则。例如,中药的药组药对中,药之间
必须是“相互依赖”的,如果药物 A 和 B 是药对,则必须是 A 通常与 B 配伍,
同时 B 也是通常与 A 配伍。如果只是 A 通常与 B 配伍,但 B 并不常与 A 配伍,
则 A 和 B 不是药对,因为 B 通常是只起辅助药性作用的药,这类药常在各种方
剂中出现。用基于支持度-置信度框架理论的关联规则挖掘方法不能找出上述中
药药组药对。
(3)找到的强规则并不一定是有趣的,甚至是错误的
假定对分析涉及的家用电脑和 VCD 播放机的事务感兴趣。在所分析的
10000 个事务中,6000 个事务包含家用电脑,7500 个事务包含 VCD 播放机,4000
个事务同时包含家用电脑和 VCD 播放机。运行传统的关联规则挖掘程序,最小
支持度 30%,最小置信度 60%,将发现下面的关联规则:
buys(X,“computer”)� buys(X,“vcd-player”)
[support=40%,confidence=66%]
该规则是强关联规则。可事实上,电脑和 VCD 播放机是负相关的,买其中
之一实际上减少了买另一种的可能性,因为购买 VCD 播放机的可能性是 75%,
大于 66%。
2.2 双向关联规则
定义 1(双向关联规则):设 I={i
1
,i
2
,…,i
m
}是项的集合,任务相关的数据 D
是数据库事务的集合,其中每个事务 T 是项的集合,使得 T
�
I。每个事务有一
个标示符,称作 T
ID
。设 A 是一个项集,事务 T 包含 A 当且仅当 A
�
T。如果 A
�
I,B
�
I,并且 A∩B=�,则形如 AB 的表达式称为双向关联规则。
显然双向关联规则是同时满足 A=>B 和 B=>A 的规则。反过来也可以说同时
满足 A=>B 和 B=>A 的规则是双向关联规则。所有双向关联规则 A B 有两个
置信度。 一个是关联规则 A=>B 的置信度:
conf(A=>B) = P(B|A) = P(AB) / P(A)
另一个是关联规则 B=>A 的置信度:
conf(A=>B) = P(A|B) = P(AB) / P(B)
置信度 conf(A=>B)表示 A 出现的条件下 B 出现的条件概率,也就是 A 和 B
同时出现的概率与 A 出现的概率的比值。它反映了 A 对 B 的依赖程度。它的值
越大,则 A 对 B 的依赖越强;反之,值越小,则 A 对 B 的依赖越弱。如果值为
1,则意味着 A 的每一次出现都伴随着 B 的出现(反过来则不一定),A 对 B 是
100%的依赖。
置信度 conf(B=>A)表示 B 出现的条件下 A 出现的条件概率,也就是 B 和 A
同时出现的概率与 B 出现的概率的比值。它反映了 B 对 A 的依赖程度。它的值
![](https://csdnimg.cn/release/download_crawler_static/87795701/bg6.jpg)
第 3 页 共 24 页
越大,则 B 对 A 的依赖越强;反之,值越小,则 B 对 A 的依赖越弱。如果值为 1,
则意味着 B 的每一次出现都伴随着 A 的出现(反过来则不一定),B 对 A 是 100%
的依赖。
双向关联规则 A B 的这两个置信度共同反映了 A 和 B 的相互依赖程度。
我们很多时候对相互依赖程度高的规则——即下面定义的强双向规则感兴趣。
定义 2(强双向规则):规则 A=>B 和 B=>A 同时满足最小置信度阈值
(min_conf)的双向规则称作强双向规则。
下面把上述概念推广到多个项集之间的情况。
定义 3(n 个项集的双向关联规则):设 Ci�I(2<i≤n),并且 C
i
∩C
j
=��
(2<i≤n,2<j≤n,i≠j),n 项集 C
1
、C
2
、…,C
n
的双向关联规则为同时满足
C
1
=>C
2
C
3
…C
n
、C
2
=>C
1
C
3
…C
n
、…、C
i
=>C
1
C
2
…C
i-1
C
i+1
…C
n
、…、C
n
=>C
1
C
2
…C
n-1
的规则,此时 C
1
=>C
2
C
3
…C
n
、C
2
=>C
1
C
3
…C
n
、…、C
i
=>C
1
C
2
…C
i-1
C
i+1
…C
n
、…、
C
n
=>C
1
C
2
…C
n-1
的置信度分别为:
Conf(C
1
=>C
2
C
3
…C
n
) = P(C
2
C
3
…C
n
|C
1
) = P(C
1
C
2
…C
n
) / P(C
1
)
Conf(C
2
=>C
1
C
3
…C
n
) = P(C
1
C
3
…C
n
|C
2
) = P(C
1
C
2
…C
n
) / P(C
2
)
……
Conf(C
n
=>C
1
C
3
…C
(n-1)
) = P(C
1
C
2
…C
(n-1)
|C
n
) = P(C1C
2
…C
n
) / P(C
n
)
如果 C
1
=>C
2
C
3
…Cn、C
2
=>C
1
C
3
…C
n
、…、Ci=>C
1
C
2
…C
i-1
C
i+1
…C
n
、…、
C
n
=>C
1
C
2
…C
n-1
同时满足最小置信度阈值(min_conf),则项集 C
1
、C
2
、…、C
n
的双向关联规则是强双向规则。
项的集合称为项集(itemset),包含 k 个项的项集称为 k-项集。我们把上述概
念用于 k-项集,可得到如下定义:
定义 4(项的置信度):设 T
k
={I
1
,I
2
,…,I
k
}是一个 k-项集,I
i
(1≤I≤k)是 T
k
的一项,则 k-项集 T
k
的项 Ii 的置信度 conf(Ii,T
k
)为事务数据库 D 中包含{I
i
}的事
务同时包含{I
1
,I
2
,…,I
(i-1)
,I
(i+1)
,…,I
k
}的百分比,即:
Conf(Ii,T
k
) = P({I
1
,I
2
, …,I
(i-1)
,I
(i+1)
, ,I
k
}|{Ii})=P({I
1
,I
2
, …,I
i
, …,I
k
})/P({Ii})
定义 5(k-项集强双向规则):设 T
k
={I
1
,I
2
,…,I
k
}是事务数据库 D 中一个 k-
项集,如果 T
k
的任一项的置信度都满足最小置信度阈值(min_conf),则称 k-项集
T
k
为符合强双向规则的 k-项集,简称 k-项集强双向规则。
2.3 遗传算法简介
遗传算法(Genetic Algorithm, GA)是近几年发展起来的一种崭新的全局优
剩余25页未读,继续阅读
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://profile-avatar.csdnimg.cn/5d3d17b770eb4c6785682f01b138d5bc_z9894.jpg!1)
悠闲饭团
- 粉丝: 168
- 资源: 3329
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- VMP技术解析:Handle块优化与壳模板初始化
- C++ Primer 第四版更新:现代编程风格与标准库
- 计算机系统基础实验:缓冲区溢出攻击(Lab3)
- 中国结算网上业务平台:证券登记操作详解与常见问题
- FPGA驱动的五子棋博弈系统:加速与创新娱乐体验
- 多旋翼飞行器定点位置控制器设计实验
- 基于流量预测与潮汐效应的动态载频优化策略
- SQL练习:查询分析与高级操作
- 海底数据中心散热优化:从MATLAB到动态模拟
- 移动应用作业:MyDiaryBook - Google Material Design 日记APP
- Linux提权技术详解:从内核漏洞到Sudo配置错误
- 93分钟快速入门 LaTeX:从入门到实践
- 5G测试新挑战与罗德与施瓦茨解决方案
- EAS系统性能优化与故障诊断指南
- Java并发编程:JUC核心概念解析与应用
- 数据结构实验报告:基于不同存储结构的线性表和树实现
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)