判别式模型和生成式模型

对比判别式模型生成式模型
特点寻找不同类别之间的最优分类面,反映异类数据之间的差异对后验概率建模,以统计的角度表示数据的分布情况,能够反映同类数据本身的相似度
区别(假如输入特征x,类别标签y)估计的是条件概率分布 `P(yx)`估计的是联合概率分布 P(x,y)
联系由判别式模型不能得到生成式模型由生成式模型可以得到判别式模型(贝叶斯公式)
优势(1)能清晰地分辨出多类或某一类与其他类之间的差异特征;(2)适用于较多类别的识别;(3)模型更简单(1)研究单类问题比判别式模型更灵活;(2)模型可以通过增强学习得到;(3)能用于数据不完整的情况。
缺点不能反映训练数据本身的特性。能力有限,可以告诉你的是1还是2,没法把整个场景描述出来学习和计算过程比较复杂
性能较好(因为利用了训练数据的类别标识信息)较差
常见模型举例KNN,SVM,决策树,线性回归,LR,boosting,线性判别分析(LDA),条件随机场,感知机,传统神经网络朴素贝叶斯,隐马尔科夫模型,高斯混合模型,限制玻尔兹曼机
主要应用场景图像文本分类,时间序列预测NLP,医疗诊断

总结一句话,生成模型是预测联合概率分布,判别模型则直接预测出结果。

------ 本文结束------
坚持原创技术分享,您的支持将鼓励我继续创作!

欢迎关注我的其它发布渠道