TF-IDF、词袋模型与特征工程

TF-IDF、词袋模型与特征工程

如标题,TF-IDF与词集词袋模型都是数据预处理中常用的算法,这里介绍一下这两种算法的联合应用。 一. 词集与词袋模型 这个算法的主要作用也就是对文本做单词切分...