sponsored links

统计分类专题

线性分类器

November 16
线性分类器
在机器学习领域,分类的目标是指将具有相似特征的对象聚集.而一个线性分类器则透过特征的线性组合来做出分类决定,以达到此种目的.对象的特征通常被描述为特征值,而在向量中则描述为特征向量. 定义 如果输入的特征向量是实数向量,则输出的分数为: , 其中是一个权重向量,而f是一个函数,该函数可以通过预先定义的功能块,映射两个向量的点积,得到希望的输出.权重向量是从带标签的训练样本集合中所学到的.通常,&q ...

朴素贝叶斯分类器

October 26
朴素贝叶斯分类器
在机器学习中,朴素贝叶斯分类器是一系列以假设特征之间强(朴素)独立下运用贝叶斯定理为基础的简单概率分类器. 朴素贝叶斯自20世纪50年代已广泛研究.在20世纪60年代初就以另外一个名称引入到文本信息检索界中, 并仍然是文本分类的一种热门(基准)方法,文本分类是以词频为特征判断文件所属类别或其他(如垃圾邮件.合法性.体育或政治等等)的问题.通过适当的预处理,它可以与这个领域更先进的方法(包括支持向量 ...

ROC曲线

October 17
ROC曲线
3条ROC曲线 在信号检测理论中,接收者操作特征曲线(receiver operating characteristic curve,或者叫ROC曲线)是一种座标图式的分析工具,用于 (1) 选择最佳的信号侦测模型.舍弃次佳的模型. (2) 在同一模型中设定最佳阈值. 在做决策时,ROC分析能不受成本/效益的影响,给出客观中立的建议. ROC曲线首先是由二战中的电子工程师和雷达工程师发明的,用来侦 ...