【算法岗必看系列】机器学习高频知识点-SVM原理
大家好,我是鬼仔里,是腾讯-微信事业群的一名算法工程师,今天跟牛友们分享一下 支持向量机 (support vector machine-SVM) 的原理。SVM是机器学习中最基础的分类算法之一,很多同学可能都很熟悉,但是一部分同学可能只理解了较为浅层的知识,可以应付一些常见的八股文面试题,但如果面试官不按常规套路出牌,问一些比较冷门或者比较底层的原理问题,很多同学可能就招架不住了。这篇文章是我以前参考他人资料整理的,分享出来希望能够帮助大家深入SVM的原理,同时更重要的是做个记录,便于以后自己复习:)。
一、线性分类基础
一句话描述支持向量机SVM:SVM是一种二分类模型,其定义为特征空间上的间隔最大的线性分类器,其优化目标是最大化间隔,最终可转化为一个凸二次规划问题的求解。
我们先考虑一个最简单的线性分类的例子,如下图所示,现在有一个二维平面,平面上有两类数据,分别用圈和叉表示。由于这些数据是线性可分的,所以可以用一条直线将这两类数据分开,这条直线就相当于一个超平面(hyper plane),超平面一边的数据点所对应的y全是-1 ,另一边所对应的y全是1。
这个超平面可以用分类函数 表示,当f(x)等于0的时候,x便是位于超平面上的点,而f(x)大于0的点对应 的数据点,f(x)小于0的点对应 的点,如下图所示:
理论上,存在无数个满足条件的分类超平面,那么如何确定这个超平面呢?从直观上而言,最适合分开两类数据的超平面应该使得离分割平面两边数据的间隔最大,所以,我们需要寻找 有着最大间隔的超平面。
二、间隔的定义(函数间隔与几何间隔)
在超平面 确定的情况下, 能够表示点x到距离超平面的远近,而通过观察 的符号与类标记y的符号是否一致可判断分类是否正确。函数间隔(functional margin)的定义为:
输入职位的基础是低间隔
本人编辑
©2022 Baidu 使用百度前必读 | 百科协议 | 输入职位的基础是低间隔 隐私政策 | 百度百科合作平台 | 京ICP证030173号
输入职位的基础是低间隔
2. 表单的构成(视觉角度)
- 标签:明确该项应输入/选择什么内容,部分表单没有标签,例如登录页,直接以图标、占位符提示录入的内容;
- 输入区:与用户发生交互的区域,通常用输入框、分隔线、选项框、开关…等常见元素提示;
- 占位符:用于描述表单内容的详细说明、录入规则、注意事项等,光标插入或有内容录入时占位符消失;
- 图标:带有图标的表单页面,通常存在较复杂的次级任务,伴随下拉框、弹窗或页面跳转来完成前置条件;
- 按钮:表单中的任务按钮(非保存/提交)与单选作用相同,用于选项条件较少的表单内容。
3. 表单的各种状态
- 交互前:在用户未发生任何操作时,表单为默认的初始化状态;
- 交互中:光标插入即成为聚焦状态,占位符消失,随着内容的输入,输入框后面显示一键清除图标;
- 交互后:输入完成光标离开,前端如验证内容有误会立即反馈,无误则回到正常输入后的状。
二、表单元素拆解及设计细节
1. 结构/框架
3. 占位符
需对输入的内容设计规范格式,例如地址“广东省 深圳市 龙华区”、手机号码“138 888 88888”,将同一组较长的数字间隔区分,更便于浏览记忆。