ap任务:(1)依据所输入文件路径利用最小支持度的频繁项集分割原始网络安全数据集为大小为n的数据子集,格式化处理所分割的各子集,获取键值对,其中value与key分别表示数据信息以及字符偏移量。(2)将所获取不同子集中的键值对依据Map函数读取,将数据信息value利用split函数解析,将解析结果传送至集合内;(3)利用输出key表示全部子集,设子集value值等于1;(4)调用全部可选的bin函数,全部Map端在网络安全数据中生成相同key值的键值对,通过bin函数合并全部相同的键值对,改善通过网络将所获取的键值对发送至Reduce端造成运算效率低的缺陷;Reduce任务:(1)排序bin函数所发送的键值对,合并相同key值的键值对,获取,所获取键值对利用Re-duce函数读取,累加键值对中L()内的值。网络安全数据集R内key集合的支持数量,所获取结果即Reduce端具有频繁候选项集的全局支持度;(2)将高于最小支持度的候选项集基于最小支持度发送至存储数据外部表内,利用所获取外部表查询挖掘所获取的频繁项集,设置该频繁项为MapReduce程序的输入以及输入相关文件。将最小置信度δ以及满足最小置信度δ的关联规则分别作为挖掘网络安全事件关联规则的输入与输出,运算过程如下:(1)选取Map函数启动setup法连接数据库;(2)分割存储数据所建立外部表内的频繁项集,完成分割后获取数量为n的数据子集,将全部数据格式化处理至键值对;(3)解析value内频繁项集内元素,完成解析后获取相应value值用(C,D,SValue)表示,将所获取的(C,D)存储至集合中;(4)求解频繁项集内元素子集C,读取元素子集C支持度sup(C),利用表示C→D的置信度。(5)当所获取置信度高于已设定阈值时,所获取的频繁项集内部包含该子集外的全部元素与该子集存在关联规则,利用所获取差集与子集建立key值,该key值的置信度值即value。通过以上过程挖掘网络安全事件关联规则,利用支持向量机方法基于所挖掘关联规则实现网络安全风险估计。
2.2网络安全风险估计方法
将所挖掘关联规则作为网络安全事件特征,利用所挖掘关联规则估计网络安全风险。利用样本输入xi以及样本输出yi所组成的(xi,yi)表示网络安全事件训练样本集,该样本集满足xiRn,yiRn。网络安全事件样本集(xi,yi)内网络安全事件样本利用非线性映射函数φ()映射至高维特征空间内,可得网络安全事件评估的最优线性回归函数表达式如下:(2)式中,b与w分别表示偏置量以及权值。利用结构风险最小化原则获取LSSVM回归模型的解,可得公式如下:(3)(4)式中,ei与C分别表示回归函数与实际结果的误差以及惩罚函数。将公式(4)的约束优化问题引入拉格朗日乘子可得公式如下:(5)式中,ai表示拉格朗日乘子。依据Mercer条件定义核函数公式如下:(6)选取径向基核函数设置为网络安全风险估计的核函数,可得径向基核函数表达式如下:(7)获取最终支持向量机回归模型如下:(8)式中,σ为径向基核函数宽度。支持向量机参数决定其估计精度,选取合适的参数有助于提升网络安全风险估计精度。选取QPSO算法对支持向量机的参数寻优。QPSO算法设置存在数量为m的粒子于维度为D的搜索空间内,粒子原始位置用xi(xi1,xi2,…,xid)表示,PB(pb1,pb2,…,pbd)表示当前最优位置,GB(bg1,bg2,…,bgd)表示全局最优位置。粒子进化表达式如下:(8)式中,mbest与β分别表示粒子群内最优粒子值以及算法收敛速