机器学习数据处理流

机器学习数据处理流

最近有点忙,挺长时间没写日志了,整理了一下机器学习数据处理整个阶段可能涉及的东西,分享一下. XMind附件:思维导图...
时序模型研究

时序模型研究

一、研究原因最近一段时间都在做对时序的研究,而这源于在做对攻击payload向量化的时候遇到的一些存在的问题。机器学习中黑白集都必须最终实例化为数组的形式,才能...
机器学习库sklearn中svm函数特性详解

机器学习库sklearn中svm函数特性详解

本文可能是你能在网上找到的对svm参数解析最详细的一篇文章。写文源于之前使用到svm做攻击识别,一直纠结于一些函数的参数,对我个人自定义的一些偏好设定无法很好的...
TF-IDF、词袋模型与特征工程

TF-IDF、词袋模型与特征工程

如标题,TF-IDF与词集词袋模型都是数据预处理中常用的算法,这里介绍一下这两种算法的联合应用。 一. 词集与词袋模型 这个算法的主要作用也就是对文本做单词切分...
K-means在Python中的实现

K-means在Python中的实现

K-means算法简介 K-means是机器学习中一个比较常用的算法,属于无监督学习算法,其常被用于数据的聚类,只需为它指定簇的数量即可自动将数据聚合到多类中,...