从数学入手,3招打破机器学习的边界

来源: 数据与算法之美 作者: | 发布时间: 2018-12-11 18:05:22

3招打破机器学习工程师的边界

全世界只有3.14 % 的人关注了

数据与算法之美


本文约2007余字,阅读需要约6分钟;

系统资料领取见文末;

关键词:人工智能,机器学习,深度学习,数学,学习建议


01.机器学习工程师的边界是什么?


大多数的事物都是有边界的。那机器学习的边界又是什么呢?

对,就是数学。掌握了数学这个机器学习的底层基础,不仅可以加深对算法的理解,还能在模型优化阶段更加游刃有余。



02.如何打破边界?

希望以下的内容能给你参考思路。


   机器学习中的数学基础

方法建议:将实际意义与兴趣赋予看似枯燥的学习之后,尽量死磕最少必要知识。



上图是个使用逻辑回归判断一个男生是否是一位合适的女婿的例子。


其中,Y=w1*身高+w2*品德+w3*财富+w4*颜值+w5*就可以表达为多项式Y=w1*x1+w2*x2+w3*x3+w4*x4+w5*5,通过Sigmoid函数后,转化为该男生可能成为优秀女婿的概率问题。


这里会涉及sigmoid函数、求导算法、梯度下降、正则项控制过拟合等数学知识。遇到问题解决问题,死磕关键点,才不会钻入牛角尖,陷入数学知识的汪洋大海中孤立无援。


•   机器学习中的线性代数

方法建议:尽量将线性代数与现实意义结合起来


对于线性代数,理解它与机器学习的关键在于:理解线性代数与现实世界的巧妙的耦合。




上图中的x,y可以分别代表观察事物的2个维度。


x,y各自有大量的线性组合,意味着事物的2个维度有大量不同的看法,


将这些看法用机器来进行计算、归纳、演绎,并组合大量个别的看法,抽离出符合大多数的平衡点,从而得出普遍适用的结论。这不就是一件奇妙的巧妙而耦合的事件嘛~


•   机器学习中的概率统计

方法建议:尽量将看似无味的概率统计知识与感兴趣的话题结合起来理解


隐马尔科夫(HMM)算法是机器学习中的一个概率图模型,也是很多算法岗位面试中的考察难点。来自知乎的王蒟蒻,就用一个游戏的场景清楚的解释了隐马尔科夫(HMM)算法的原理。

https://www.zhihu.com/question/20962240/answer/33614574(链接)


我是一战士,修炼出了三种战斗形态,分别为暴怒态,正常状态和防御态。同时我也会三个被动技能,分别是普通平A,爆击(攻击伤害翻倍),吸血(生命汲取)。


我在暴怒状态下打出暴击的概率是80%,打出吸血概率为5%;
在平衡形态下,打出暴击的比率为30%,打出吸血的概率是20%;
在防御形态下,暴击成功概率为5%,吸血概率为60%。


总结一下,战士在不同状态下能打出技能的概率不一样。


本来,战士这个职业在暴怒态时,身边会有一圈红光环;防御态时,会有一圈蓝光环。但是,现在我正在玩游戏,游戏突然出了个bug:有个傻x程序员改了游戏的代码,他给写崩了,从此战士身边光环都看不见了。那我没法通过看脚下的光环知道战士在爆什么状态了。


话说,现在问题来了:由于看不到脚下光环,我只能估计“战士”在爆什么状态;但我现在打一boss,砍10次,发现8次都是暴击,血哗哗地翻倍在掉,你觉得我这战士最可能是爆了什么状态?


所以,通过自己感兴趣的话题来理解深奥的概率问题,就轻松很多了。

 


03.打破边界的误区


也许你早已意识到高等数学、线性代数、概率统计对做机器学习的重要性,也在积极补课中,于是一头扎进大学的教材中。但埋头死磕了好多次,每次都半途而费,学了很多,学到的很少。


因为教材始终更偏向理论。优点是每一步都可靠,逻辑严谨;但缺点就是很难理解。


古语有云:“独学而无友则孤陋而寡闻”,多人学习,协作学习能较快认识到打破机器学习边界的误区,尽可能的使用合适的学习方法。


推荐网易云课堂联合稀牛学院共同推出的人工智能系列微专业课程,由知名企业一线人工智能专家打造,结合工业界应用经验设计学习路径,并且有讲师助教为你答疑解惑,真正带你从入门到精通。


以下福利限时免费:


PART 1

免费直播课

直播主题

《用机器学习算法剖析大神战术,顺利吃鸡!》

12月13日 周四 20:00


直播大纲

1. 数据可视化, 花样分析吃鸡的必胜之道

2. 从数据角度区分玩家风格:非监督学习之k-means聚类

3.动态数据可视化,深层分析每一类玩家特征

4. 搭建游戏排名预测的基线:监督学习之RandomForest做回归预测

5.特征工程在预测中的重要性,如何提升预测准确率


直播讲师


潘皓文 哥伦比亚大学

三年Kaggle 比赛经历,多次获得top 5%名次

主研机器学习在金融行业的应用和深度学习终端产品化落地


PART 2

免费体验课

《机器学习基础》


课程大纲

1.机器学习的就业前景

2.Python实战学习

(附15天学习计划和趣味项目源码)

3.机器学习工程师的实际应用


小姐姐群内答疑


PART 3

人工智能学习资料包

6个实战案例学习资料及代码

面试相关问题

程序员简历模板

数学基础学习资料

134篇国际经典论文集


领取方式

扫码即可预约小姐姐直播

获取所有免费福利


点击【阅读原文】,一键领取所有福利~

公众号导航