改进证据理论在中医诊断模型中的应用
0引 言
中医辨证是对症状信息的整合与分析,要求医师有扎实的中医知识和丰富的诊断经验,给中医的传承和应用带来了挑战。智能诊断是中医信息化发展中重要的一部分,利用人工智能算法实现疾病诊断可以帮助医生更全面、准确地确定病情。国外对中医应用的研究也在不断深入,包括对中医诊断决策算法的研究[1-3]、中医药的病理研究[4]等,其中诊断决策算法以决策树、神经网络为主。国内对中医的研究更为重视,中医智能化进程不断加快[5],诊断决策算法的设计显得尤为重要,很多智能算法都曾被尝试应用到中医诊断中,其中人工神经网络算法凭借较好的非线性映射能力、自学习能力被广泛应用于中医诊断的各个层面[6,7],如BP神经网络[8,9]、RBF神经网络[10]、PNN神经网络等[11,12]。随着智能诊断应用性要求的不断提高,针对单种疾病的智能诊断无法满足应用的需求,而单个神经网络算法在应用到多种疾病混合预测时很难达到预期准确率。DS证据理论是处理不确定问题的概率组合理论,可融合不同来源的数据,在信息融合方面有很好的效果。然而对证据源本身的准确性并未进行充分考虑。基于此,给出加入证据源准确性系数的方法对DS证据理论进行改进,并以不同神经网络的预测结果作为不同证据源的基本信度函数,设计基于改进DS证据理论的诊断模型,实现对3种疾病的混合预测。
1神经网络理论
人工神经网络是对人脑神经处理事物的一种模拟,通过神经元组成网络进行数据处理,MP模型是较早且影响力最大的神经元模型,其模型如图1所示。
图1 MP神经元模型
图1中,x1…xi…xn是神经元的输入值,yo是输出值,wi是各个输入值对应的权值,b是神经元的阈值,f(.)是激活函数。神经元的输出如式(1)
激活函数也有很多种,如线性函数、S型(Sigmoid)函数、RBF(radial basis function)函数等。由于激活函数和拓展方式的区别,人工神经网络又分为很多类。在中医领域,病例数据中症状往往具有多值属性、多类标的特点,辨证也具有复杂性,使得症状与结果之间往往呈非线性关系,而神经网络凭借网络结构能够完成对数据的非线性映射,在解决这类问题上比较适用。在所设计的实验中,单个网络的预测模型选用了拓扑结构不同的BP神经网络、RBF神经网络、PNN神经网络和LVQ神经网络。
1.1BP神经网络
BP神经网络是一种多层前馈网络,网络结构为输入层、隐含层和输出层,每两层之间通过线性变换来连接,隐含层的激活函数一般为S型函数,如式(2)、式(3)
其中,xi为神经元的输入值,f(hi)为神经元的输出值。BP神经网络的性能由隐含层节点数、各层之间的连接权值、各神经元的阈值共同决定。常见的BP神经网络的结构比较简单,是最早被应用于疾病预测领域的网络结构,为智能算法应用到疾病诊断领域的实现开拓了思路和方法,但该神经网络由于自身结构的局限性,在应用时也存在一些难以解决的问题,包括模型结构上如何选择最优的隐含层神经元数目、如何解决网络运算过程中的局部最优困境,如何提高在多预期结果条件下的预测准确率等。
1.2RBF神经网络
RBF神经网络是一种单隐层前馈神经网络,计算过程比BP网络更复杂,拥有更好的非线性拟合能力。相比于BP神经网络,输入层到隐含层为非线性变换。隐含层的激活函数一般使用径向Gaussian函数,公式如式(4)
在径向Gaussian函数中,结果的值取决于输入样本相对于核函数中心的距离,在上述函数中,x为输入样本,x′为核函数中心,以两点之间的平方欧几里得距离即作为衡量输入样本与核函数中心的距离计算方式,δ表示函数的宽度。RBF神经网络的性能由径向基函数的中心、宽度以及隐含层到输出层之间的权值共同决定。通过对比BP神经网络的结构可以发现,由于激活函数的不同,RBF神经网络可以实现一定程度的非线性拟合,且学习收敛速度快,可以在短时间内将达成模型训练目标。但该网络也有一些弊端,包括模型数据的解释性差、在样本数量不充分时准确率不高等。
1.3PNN概率神经网络
PNN神经网络是一种双隐层前馈网络,结合了密度函数估计和贝叶斯决策理论。网络结构分为输入层、模式层、求和层和输出层,属于完全前向的计算过程,节省了反向误差传播的计算时间,其输入层到模式层实现非线性变换,求和层对类别进行密度函数估计。模式层的激活函数为径向基函数,输出值为一个标量。模式层的激活函数如式(5)
下一篇:没有了