Stardustsky个人博客

全部文章    总计9页,当前第2页

数据科学

K-means在Python中的实现

2

K-means算法简介K-means是机器学习中一个比较常用的算法,属于无监督学习算法,其常被用于数据的聚类,只需为它指定簇的数量即可自动将数据聚合到多类中,相同簇中的数据相似度较高,不同簇中数据相似度较低。K-menas的优缺点:优点:原理简单速度快对大数据集有比较好的伸缩性缺点:需要指定聚类数量K对异常值敏感对初始值敏感K...

11个月前 (08-25) 阅读(457) 评论()

数据科学

机器学习常用的分类器比较

0

传统的机器学习的监督学习分类分类和回归,分类是争对离散的数据,而回归是争对连续的数据,在数据预处理好的基础上要对数据进行预测,通常采用CV交叉验证来进行模型评价和选择。这篇文章通过连续的数据结合sklearn库对各种回归器做一比较:1.linearregression缺点:顾名思义,l...

1年前 (2017-04-14) 阅读(921) 评论()

数据科学

基于svm算法的简单XSS攻击识别模型

12

学习机器学习已经有段时间了,心里一直在寻思着如何将其运用在安全上,前几天刚好看到兜哥的那篇文章,于是花了两天时间实现了一个简单的基于svm的xss过滤器,这里做一个比较接地气的分享。1.概念理解首先还是科普一些基础概念,什么是SVM,SVM叫支持向量机,是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特...

1年前 (2017-04-01) 阅读(866) 评论()

数据科学

TensorFlow学习笔记(二)-概念与流程理解

4

1.tensorfolow运行流程tensorflow运行流程主要有两步,分别是构造模型和训练。在构造模型阶段,我们需要构建一个图(Graph)来描述我们的模型。所谓图,也可以理解为流程图,就是讲数据的输入->中间处理->输出的过程表示出来此时不会发生实际运算。在模型构建完毕之后,会进入训练步骤。此时才会有实际的数据输入,梯度计算等操作,如何构建...

1年前 (2017-03-24) 阅读(1372) 评论()

数据科学

TensorFlow学习笔记(一)-安装与入门

3

一.TessorFlow简介TensorFlow™是一个采用数据流图(dataflowgraphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU),服务器,移动设...

1年前 (2017-03-06) 阅读(1196) 评论()

网络安全

SaiFD指纹识别工具

2

    碍于各种琐碎和杂事,好久没写文章了,最近完成了一个简单的网站指纹识别工具demo,分享一下。    采用的是执行脚本+cms.json的格式,脚本调用cms.json文件中的cms指纹特征来进行识别,然后返回对当前网站判断的结果,列出是某种cms的可能性,概率从高到低排列...

2年前 (2017-01-19) 阅读(915) 评论()