第二周 机器学习(ML)策略(2):2.3 快速搭建你的第一个系统,并进行迭代

tech2025-01-17  0

转载http://www.shareblogs.top/2180/

目录

第一章、简介

第二章、快速搭建你的第一个系统,并进行迭代

2.1、可以往多个方向优化AI系统的性能

2.2、 快速搭建简单的初始系统,并在使用系统过程中找到优化方向

2.3、快速搭建简单初始系统的意义

2.4、参考大量学术资源时,可不搭建简单的初始系统,可搭建成熟的比较复杂的初始系统

2.5、小结:依据现有的算法,确定优化目标,然后快速搭建简单的系统。


第一章、简介

 

本文基于吴恩达人工智能课程做学习笔记、并融入自己的见解(若打不开请复制到浏览器中打开)https://study.163.com/courses-search?keyword=吴恩达。本文第二章将介绍 快速搭建你的第一个系统,并进行迭代。

 

第二章、快速搭建你的第一个系统,并进行迭代

 

2.1、可以往多个方向优化AI系统的性能

 

如果你正在开发全新的机器学习应用 ,我通常会给你这样的建议——你应该尽快建立你的第一个系统原型,然后快速迭代。让我告诉你我的意思:我在语音识别领域研究了很多年,如果你正在考虑建立一个新的语音识别系统,其实你可以走很多方向,可以优先考虑很多事情。比如有一些特定的技术,可以让语音识别系统对嘈杂的背景更加健壮,嘈杂的背景可能是说咖啡店的噪音,背景里有很多人在聊天。或者车辆的噪音、高速上汽车的噪音。或者其他类型的噪音。有一些方法可以让语音识别系统在处理带口音时更健壮,还有特定的问题和麦克风与说话人距离很远有关,就是所谓的远场语音识别。儿童的语音识别带来特殊的挑战,挑战来自单词发音方面;还有他们选择的词汇,他们倾向于使用的词汇。还有比如 说话人口吃或者说了很多无意义的短语比如哦、啊、嗯之类的短语,你可以选择很多不同的技术,让你听写下来的文本可读性更强。

 

2.2、 快速搭建简单的初始系统,并在使用系统过程中找到优化方向

 

所以你可以做很多事情,来改进语音识别系统。一般来说对于几乎所有的机器学习程序,可能会有50个不同的方向可以前进,并且每个方向都是相对合理的,可以改善你的系统。但挑战在于,你如何选择一个方向集中精力处理,即使我已经在语音识别领域工作多年了,如果我要为一个新应用程序域构建新系统,我还是觉得需要花很长时间思考方向选择问题并选择方向。所以我建议你们,如果你想搭建全新的机器学习程序,就是快速搭好你的第一个系统,然后开始迭代。我的意思是我建议,你快速设立开发集和测试集还有指标,这样就决定了你的目标所在。如果你的目标定错了,之后改也是可以的。但一定要设立某个目标。然后我建议你马上搭好一个机器学习系统原型,然后找到训练集训练一下看看效果,并开始理解你的算法表现如何、在开发集测试集你的评估指标上表现如何。当你建立第一个系统后,你就可以马上用到之前说的偏差方差分析,还有之前最后几个视频讨论的错误分析,来确定下一步优先做什么,特别是如果错误分析,让你了解到大部分的错误的来源是说话人远离麦克风问题还是其他问题,这对语音识别构成特殊挑战,那么你就有很好的理由去集中精力研究这些技术——所谓远场语音识别的技术,这基本上揪出处理说话人离麦克风很远的情况。

 

2.3、快速搭建简单初始系统的意义

 

建立这个初始系统的所有意义在于,它可以是一个快速和简单的实现。你知道的,刚开始搭建系统不需要想太多东西。初始系统的全部意义在于有一个学习过的系统、有一个训练过的系统,让你确定偏差方差的范围,就可以知道下一步应该优先做什么,让你能够进行错误分析,可以观察一些错误,然后想出所有能走的方向。即这些方向中,哪些是实际上最有希望的方向。

 

2.4、参考大量学术资源时,可不搭建简单的初始系统,可搭建成熟的比较复杂的初始系统

 

不过,如果你在这个应用程序领域有很多经验,这个建议适用程度要低一些。还有一种情况适应程度更低,当这个领域有很多可以借鉴的学术文献,处理的问题和你要解决的几乎完全相同,所以 比如说 人脸识别就有很多学术文献,如果你尝试搭建一个人脸识别设备,那么可以从现有大量学术文献为基础出发,一开始就搭建比较复杂的系统。但如果你第一次处理某个新问题,那我真的不鼓励你,想太多 或者把第一个系统弄得太复杂,我建议你们构建一些快速简单的系统实现,帮你找到改善系统要优先处理的方向。

 

2.5、小结:依据现有的算法,确定优化目标,然后快速搭建简单的系统。

 

我见过很多机器学习项目,我觉得有些团队的解决方案想太多了,他们造出了过于复杂的系统。我也见过有些团队想的不够,然后造出过于简单的系统。整体来说,我见到很多的团队构建太复杂的系统,我也见过构建系统太简单的团队。所以我希望这些策略有帮助,如果你将机器学习算法应用到新的应用程序里,你的主要目标是弄出能用的系统。你的主要目标并不是发明全新的机器学习算法,这是完全不同的目标,那时你的目标应该是想出某种效果非常好的算法。所以我鼓励你们搭建快速而简单的实现,然后用它做偏差/方差分析,用它做错误分析,然后用分析结果确定下一步优先要做的方向。

 

最新回复(0)