Stardustsky个人博客

小站共有文章 52 篇 / 标签 74 个 / 总评论 17 次 最近更新

数据科学

时序模型研究

1

一、研究原因最近一段时间都在做对时序的研究,而这源于在做对攻击payload向量化的时候遇到的一些存在的问题。机器学习中黑白集都必须最终实例化为数组的形式,才能进行训练,而这些数组的元素又必须是数字的,因此,在对一个字符串+数字+符号构成的payload进行向量化的时候,就会遇到很多的问题。比如:http://www.baidu.com/index.p...

6个月前 (02-09) 阅读(524) 评论()

网络安全

vhosts.conf配置不当引发的血案

6

说起来这个问题比较有意思,是一次偶然的意外发现,经过一系列追踪,最后发现vhosts.conf配置的锅,所以分享一波给大家,相信不少的人也会遇到和我同样的问题。起因本文源于一日我测试公司的安全产品,便对自己的网站做了一个反向代理,大概就是下图的样子。proxyip:172.12.16.118mywebip:www.stardustsky.net...

10个月前 (10-24) 阅读(693) 评论()

数据科学

机器学习库sklearn中svm函数特性详解

0

本文可能是你能在网上找到的对svm参数解析最详细的一篇文章。写文源于之前使用到svm做攻击识别,一直纠结于一些函数的参数,对我个人自定义的一些偏好设定无法很好的完成,所以对其好好的研究了一番。这篇算是一篇工具文,来详解一下pythonsklearn中svm的一些参数,以及结合具体的例子来进行详细说明。svm函数简介sklearn中的svm基于libsv...

10个月前 (10-16) 阅读(1807) 评论()

数据科学

TF-IDF、词袋模型与特征工程

0

如标题,TF-IDF与词集词袋模型都是数据预处理中常用的算法,这里介绍一下这两种算法的联合应用。一.词集与词袋模型这个算法的主要作用也就是对文本做单词切分,有点从一篇文章里提取关键词这种意思,旨在用向量来描述文本的主要内容。词集模型:单词构成的集合,集合中每个元素只有一个,即词集中的每个单词都只有一个。词袋模型:如果一个单词在文档中出现不止一次,就...

10个月前 (10-09) 阅读(707) 评论()

数据科学

TensorFlow学习笔记(三)-多层卷积代码理解

2

之前一段时间做CNN的demo,但是一直不太懂这些代码的原理,后来逐渐理解,这里也写一篇文章做下分享,部分图来自网络,侵权删。滤波的概念在理解代码之前,我们先了解一下滤波的概念,滤波又被称作平滑,是一种对图像进行处理的技术手段,通常是对图像进行模糊操作,使其特征不那么突出,常见的有中值滤波、高斯滤波、拉普拉斯滤波等。以下是高斯滤波处理前后的效果:...

11个月前 (09-19) 阅读(773) 评论()