0%

问题背景

传统排序模型只考虑有限的排序因素如词频 $tf$、词的重要性 $idf$、文档长度等,并且各个因素的组合通常采用暴力加权求和,权重往往根据经验决定。但实际上有多种信息可以用于排序,比如域名、文本相关性、词项临近度、$URL$ 深度等等,所以可以采用机器学习的方法通过数据驱动的方式学习排序模型。模型学习流程如下:

Read more »