0%

概述

聚类是无监督机器学习问题,目标是感知样本间的相似度,进行类别归纳,聚类既可以作为一个单独过程,用于寻找数据内在的分布结构,也可以作为分类、稀疏表示等其他学习任务的前驱过程。

Read more »

集成学习概述

集成学习通过将多个学习器进行结合,常可以获得比单一学习器更加优越显著的泛化能力, 在个体学习器是弱学习器(泛化能力略优于随机猜测的学习器,如在二分类问题上精度略高于 $50%$ 的学习器)的情况下尤为明显

Read more »

感知机模型是一个二分类模型,通常将输入空间映射到新的特征空间中再进行计算,模型的学习目标是寻找能够在特征空间内将实例划分为正负两类的分离超平面,其数学表达式如下:

$$ y(x)=f(w^T\phi(x))=w_0\phi(x_0)+w_1\phi(x_1)+…+w_n\phi(x_n)$$

Read more »

从天气预报说起

某地全天 $365$ 天,晴朗 $265$ 天,非晴朗 $100$ 天,我们用 $A$ 表示晴朗,用 $ \neg A $ 表示非晴朗,于是我们可以得到 $P(A) = 265/365=0.726$,$P(\neg A) = 100/365=0.274$。所以在预测天气的时候,我们更倾向于预测明天是一个晴朗的天气。

对于上述问题,如果增加一个信息:晴朗天气的前一天特征(是否有晚霞),我们用 $B$ 表示有晚霞,用 $ \neg B $ 表示没有晚霞,并且已知晴朗天气前一天有晚霞的比例是 $0.7$,非晴朗天气前一天有晚霞的比例是 $0.1$。那么,如果已知今天有晚霞,我们如何预测明天的天气呢?

Read more »