Stardustsky个人博客

Tag "机器学习" 相关文章    总计2页,当前第1页

数据科学

时序模型研究

1

一、研究原因最近一段时间都在做对时序的研究,而这源于在做对攻击payload向量化的时候遇到的一些存在的问题。机器学习中黑白集都必须最终实例化为数组的形式,才能进行训练,而这些数组的元素又必须是数字的,因此,在对一个字符串+数字+符号构成的payload进行向量化的时候,就会遇到很多的问题。比如:http://www.baidu.com/index.p...

9个月前 (02-09) 阅读(732) 评论()

数据科学

机器学习库sklearn中svm函数特性详解

0

本文可能是你能在网上找到的对svm参数解析最详细的一篇文章。写文源于之前使用到svm做攻击识别,一直纠结于一些函数的参数,对我个人自定义的一些偏好设定无法很好的完成,所以对其好好的研究了一番。这篇算是一篇工具文,来详解一下pythonsklearn中svm的一些参数,以及结合具体的例子来进行详细说明。svm函数简介sklearn中的svm基于libsv...

1年前 (2017-10-16) 阅读(2773) 评论()

数据科学

TF-IDF、词袋模型与特征工程

0

如标题,TF-IDF与词集词袋模型都是数据预处理中常用的算法,这里介绍一下这两种算法的联合应用。一.词集与词袋模型这个算法的主要作用也就是对文本做单词切分,有点从一篇文章里提取关键词这种意思,旨在用向量来描述文本的主要内容。词集模型:单词构成的集合,集合中每个元素只有一个,即词集中的每个单词都只有一个。词袋模型:如果一个单词在文档中出现不止一次,就...

1年前 (2017-10-09) 阅读(928) 评论()

数据科学

机器学习常用的分类器比较

0

传统的机器学习的监督学习分类分类和回归,分类是争对离散的数据,而回归是争对连续的数据,在数据预处理好的基础上要对数据进行预测,通常采用CV交叉验证来进行模型评价和选择。这篇文章通过连续的数据结合sklearn库对各种回归器做一比较:1.linearregression缺点:顾名思义,l...

2年前 (2017-04-14) 阅读(1065) 评论()

数据科学

基于svm算法的简单XSS攻击识别模型

12

学习机器学习已经有段时间了,心里一直在寻思着如何将其运用在安全上,前几天刚好看到兜哥的那篇文章,于是花了两天时间实现了一个简单的基于svm的xss过滤器,这里做一个比较接地气的分享。1.概念理解首先还是科普一些基础概念,什么是SVM,SVM叫支持向量机,是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特...

2年前 (2017-04-01) 阅读(1007) 评论()

数据科学

TensorFlow学习笔记(二)-概念与流程理解

4

1.tensorfolow运行流程tensorflow运行流程主要有两步,分别是构造模型和训练。在构造模型阶段,我们需要构建一个图(Graph)来描述我们的模型。所谓图,也可以理解为流程图,就是讲数据的输入->中间处理->输出的过程表示出来此时不会发生实际运算。在模型构建完毕之后,会进入训练步骤。此时才会有实际的数据输入,梯度计算等操作,如何构建...

2年前 (2017-03-24) 阅读(1500) 评论()