百面机器学习 算法工程师带你去面试
作者:诸葛越 葫芦娃
格式: pdf、txt、epub、azw3、mobi、docx
编辑推荐
不可不读的机器学习面试宝典!微软全球执行副总裁、美国工程院院士沈向洋,《浪潮之巅》《数学之美》作者吴军,《计算广告》作者、科大讯飞副总裁刘鹏,联袂推荐!
人工智能几起几落,*近这次人工智能浪潮起始于近10年,技术的飞跃发展,带来了应用前所未有的可能性。未来的几年,是人工智能技术全面普及化的时期,也是算法工程师稀缺的时期。
本书旨在帮助对人工智能和机器学习有兴趣的朋友们更加深入地了解这个领域的基本技能,帮助每个软件工程师成为自信的AI实践者,帮助每个数据科学家成为出众的AI研究者。对每个有志进入此领域的工程师来说,本书会为你铺设一条快速通往目标的道路。
内容简介
人工智能领域正在以超乎人们想象的速度发展,本书赶在人工智能彻底占领世界之前完成编写,实属万幸。
书中收录了超过100道机器学习算法工程师的面试题目和解答,其中大部分源于Hulu算法研究岗位的真实场景。本书从日常工作、生活中各种有趣的现象出发,不仅囊括了机器学习的基本知识,而且还包含了成为出众算法工程师的相关技能,更重要的是凝聚了笔者对人工智能领域的一颗热忱之心,旨在培养读者发现问题、解决问题、扩展问题的能力,建立对机器学习的热爱,共绘人工智能世界的宏伟蓝图。
“不积跬步,无以至千里”,本书将从特征工程、模型评估、降维等经典机器学习领域出发,构建一个算法工程师必-备的知识体系;见神经网络、强化学习、生成对抗网络等新科研进展之微,知深度学习领域胜败兴衰之著;“博观而约取,厚积而薄发”,在末一章为读者展示生活中各种引领时代的人工智能应用。
作者简介
诸葛越:现任Hulu公司全球研发副总裁,中国研发中心总经理。曾任Landscape Mobile 公司联合创始人兼CEO,前雅虎北京全球研发中心产品总监, 微软北京研发中心项目总经理,雅虎美国高级软件架构师。诸葛越获美国斯坦福大学的计算机硕士与博士,纽约州立大学石溪分校的应用数学硕士,曾就读于清华大学计算机科学与技术系。诸葛越的研究结果获多项专利,2005年获美国计算机学会数据库专业委员会十年最佳论文奖。
葫芦娃:15位Hulu北京创新实验室的人才。他们利用擅长的机器学习、深度学习等领域知识和算法模型,建立了一套定制化的机AI平台,改变着推荐引擎、视频编解码、内容理解、广告投放等多项与用户息息相关的在线业务技术。
目 录
推荐序
前言
机器学习算法工程师的自我修养
第 1章 特征工程
第 1节 特征归一化
第 2节 类别型特征
第3节 高维组合特征的处理
第4节 组合特征
第5节 文本表示模型
第6节 Word2Vec
第7节 图像数据不足时的处理方法
第 2章 模型评估
第 1节 评估指标的局限性
第 2节 ROC 曲线
第3节 余弦距离的应用
第4节 A/B 测试的陷阱
第5节 模型评估的方法
第6节 超参数调优
第7节 过拟合与欠拟合
第3章 经典算法
第 1节 支持向量机
第 2节 逻辑回归
第3节 决策树
第4章 降维
第 1节 PCA 最大方差理论
第 2节 PCA 最小平方误差理论
第3节 线性判别分析
第4节 线性判别分析与主成分分析
第5章 非监督学习
第 1节 K 均值聚类
第 2节 高斯混合模型
第3节 自组织映射神经网络
第4节 非监督学习算法的评估
第6章 概率图模型
第 1节 概率图模型的联合概率分布
第 2节 概率图表示
第3节 生成式模型与判别式模型
第4节 马尔可夫模型
第5节 主题模型
第7章 优化算法
第 1节 有监督学习的损失函数
第 2节 机器学习中的优化问题
第3节 经典优化算法
第4节 梯度验证
第5节 随机梯度下降法
第6节 随机梯度下降法的加速
第7节 L1 正则化与稀疏性
第8章 采样
第 1节 采样的作用
第 2节 均匀分布随机数
第3节 常见的采样方法
第4节 高斯分布的采样
第5节 马尔科夫蒙特卡洛采样法
第6节 贝叶斯网络的采样
第7节 不均衡样本集的重采样
第9章 前向神经网络
第 1节 多层感知机与布尔函数
第 2节 深度神经网络中的激活函数
第3节 多层感知机的反向传播算法
第4节 神经网络训练技巧
第5节 深度卷积神经网络
第6节 深度残差网络
第 10章 循环神经网络
第 1节 循环神经网络和卷积神经网络
第 2节 循环神经网络的梯度消失问题
第3节 循环神经网络中的激活函数
第4节 长短期记忆网络
第5节 Seq2Seq 模型
第6节 注意力机制
第 11章 强化学习
第 1节 强化学习基础
第 2节 视频游戏里的强化学习
第3节 策略梯度
第4节 探索与利用
第 12章 集成学习
第 1节 集成学习的种类
第 2节 集成学习的步骤和例子
第3节 基分类器
第4节 偏差与方差
第5节 梯度提升决策树的基本原理
第6节 XGBoost 与GBDT 的联系和区别
第 13章 生成式对抗网络
第 1节 初识GANs 的秘密
第 2节 WGAN:抓住低维的幽灵
第3节 DCGAN:当GANs 遇上卷积
第4节 ALI:包揽推断业务
第5节 IRGAN:生成离散样本
第6节 SeqGAN:生成文本序列
第 14章 人工智能的热门应用
第 1节 计算广告
第 2节 游戏中的人工智能
第3节 AI 在自动驾驶中的应用
第4节 机器翻译
第5节 人机交互中的智能计算
后记
作者随笔
参考文献
商品评价
为了方便大家利用电子书更好的学习,精心整理了网络上的各种电子书,有PDF版本的,也有TXT版本的,现有一万多本PDF的,七万多本TXT的,还有精心整理的天涯神贴,而且还在不断增加中,有需要的可以点击下面的衔接或者扫码下载:
链接: https://pan.baidu.com/s/1z45OMvYM0Jy-BVuJJmRvtw?pwd=w3m9 提取码: w3m9 复制这段内容后打开百度网盘手机App,操作更方便哦
请先
!