一、使用joblib保存结果
代码如下:
代码如下:
逻辑回归即使用一个超平面将整个空间一分为二,并且在边界附近赋予连续(即不是非黑即白,而是可以有0-1之间的小数概率)的概率估计的二分类方法。
逻辑回归使用\(θX\)作为划分数据的边界。
逻辑回归使用
\[ g( Z) =\frac{1}{1+e^{Z}} \]
替代离散的分布函数,其中,g(Z)即概率统计中的分布函数,可根据极大似然估计得到使用已有样本点估计的近似值:从理论上来讲,此时的似然函数应该是最大的,可以用梯度上升法求之。
np.array
转化宽度不一致的数组时会出现未知错误,使用时要谨慎。a[1,2]
和b[1][2]
。np.append(red,[vx],axis=0)
此处的vx必须升维到与大矩阵相同,axis表示添加一行yellow=np.r_[yellow,[vx]]
,道理同上
Fwaf是GitHub上的一个机器学习Web恶意请求防火墙,代码比较简洁,思路也比较清晰,由于和自己的某个想法很契合,就稍作分析。
Fwaf使用sklearn库训练样本集。
其中,使用TfidfVectorizer对字符串进行特征化。
在远程登陆Linux时,要远程启动多个程序,分屏显得很重要。 在这里小记一下几种简单的分屏命令。
使用tmux对terminal分屏,常用指令如下:
开启tmux:在terminal中输入tmux开启分屏。
tmux ls: 显示已有的tmux会话
tmux attach-session -t 数字: 选择tmux
tmux kill-session -t session-name:关闭tmux
开启鼠标移动、调节窗口大小等功能:[ctrl]+b+:后输入 set -g mouse on
机器学习可以进行的条件:
1、 有某种模式可以学习。
2、 这种模式不知道怎么手工明确规定(如果通过编写可以实现的就不需要机器学习)。
3、 有数据资料。
机器学习四种元素:
1、 输入X。
2、 输出Y。
3、 hypothesis H。
4、 资料 D
数据挖掘和机器学习有很多重合点,但不是一模一样。