2018年09月12日 机器学习数据处理流 最近有点忙,挺长时间没写日志了,整理了一下机器学习数据处理整个阶段可能涉及的东西,分享一下. XMind附件:思维导图... 数据科学 1927 人阅读 0 条评论 阅读全文
2018年02月09日 时序模型研究 一、研究原因最近一段时间都在做对时序的研究,而这源于在做对攻击payload向量化的时候遇到的一些存在的问题。机器学习中黑白集都必须最终实例化为数组的形式,才能... 数据科学 3285 人阅读 2 条评论 阅读全文
2017年10月16日 机器学习库sklearn中svm函数特性详解 本文可能是你能在网上找到的对svm参数解析最详细的一篇文章。写文源于之前使用到svm做攻击识别,一直纠结于一些函数的参数,对我个人自定义的一些偏好设定无法很好的... 数据科学 17582 人阅读 0 条评论 阅读全文
2017年10月09日 TF-IDF、词袋模型与特征工程 如标题,TF-IDF与词集词袋模型都是数据预处理中常用的算法,这里介绍一下这两种算法的联合应用。 一. 词集与词袋模型 这个算法的主要作用也就是对文本做单词切分... 数据科学 3223 人阅读 1 条评论 阅读全文
2017年09月19日 TensorFlow学习笔记(三)-多层卷积代码理解 之前一段时间做CNN的demo,但是一直不太懂这些代码的原理,后来逐渐理解,这里也写一篇文章做下分享,部分图来自网络,侵权删。 滤波的概念 在理解代码之前,我们... 数据科学 3822 人阅读 0 条评论 阅读全文
2017年08月25日 K-means在Python中的实现 K-means算法简介 K-means是机器学习中一个比较常用的算法,属于无监督学习算法,其常被用于数据的聚类,只需为它指定簇的数量即可自动将数据聚合到多类中,... 数据科学 2059 人阅读 0 条评论 阅读全文