好了,并不是所有事物都和听说的那样美好,机器学习也有它的局限之处。我们不能构建类似于《星际迷航》中的Data或者《2001太空漫游》中的Hal 9000这样的智能机器。但是,我们拥有足够的现实世界的应用程序,机器学习在此神奇般的起着作用。下面是一些实用机器学习应用中最常见的分类: 图像处理 图像处理的问题基本上都需要分析图像获取数据或是做一些转换。下面是一些例子:
文本分析 文本分析是我们从文本文件,比如推特,邮件,聊天记录,文档等中提取或分类信息。下面是一些流行的例子:
数据挖掘 数据挖掘是用来从数据中发现某些模式或者做出预测。这个定义有点普通,不过你可以理解成从海量数据库表中挖掘有用的信息。每一行都可以是我们的训练实例,每一列都可以作为一个特征。我们可能会感兴趣用表中剩下的列来预测一条新的列,或者发现某种模式来对行进行分组。比如:
视频游戏与机器人 视频游戏和机器人是机器学习得到应用的一个巨大领域。一般来说我们有一个Agent(游戏角色或机器人),它必须根据环境(视频游戏中的虚拟环境或者对于机器人来说的真实环境)来行动。机器学习可以使这个Agent执行任务,比如移动到某个环境中而同时避开障碍或者敌人。在这些情形下一个最受欢迎的机器学习技术是强化学习,Agent通过学习环境的强化系数(如果Agent碰到了障碍物强化系数则为负,如果达到目标则为正)来执行任务。
大约10年前我读过的第一批关于机器学习书籍中有一本是Tom Mitchell写的《机器学习》。这本书是1997年写的,但是书中的总体概念在今天仍然有用。 在那本书中,我喜欢书中对机器学习的正式定义,如下: 对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E学习。 比如,人工游戏玩家要学会下国际象棋(任务T),可以通过查看以前国际象棋比赛或与导师对弈(经验E)来学习。它的性能P可以用它与人类玩家对弈获胜的比例来度量。 让我们用更多例子来阐述: 案例1:向系统中输入一张图片,系统需要判别图片中是否有巴拉克·奥巴马的脸(一般来说是类似于Facebook的图像自动标记)。 案例2:向系统中输入一条推文,系统判别这条推文是否带有积极或消极情感。 案例3:向系统中输入某人的一些信息,系统计算出此人偿还信用卡贷款的概率。 在案例1中,系统任务是检测巴拉克·奥巴马的脸何时在图像中出现。可以将他出现在哪些照片或不出现在哪些照片中的信息作为经验。系统的性能可以用系统正确识别出奥巴马脸的次数比例来度量。 在案例2中,系统任务是对一条推文进行情感分析。系统的经验可以是一组推文和与它们相对应的情绪。系统的性能可以由系统对新推文情感分析正确的比例来度量。 在案例3中,系统任务是进行信用评分。系统可以将一系列用户资料和相对应的信用评分作为经验。可以用平方误差(预测和预期得分之间的差异)作为性能度量。 为了让算法学习将输入转换成期望的输出,你必须提供训练实例或者训练样例,也就是Mitchell所定义的经验E。一组训练集是一系列实例的集合,它们将作为样例,机器学习算法从这些样例中学习并且完成预期任务。很好理解,不是吗?这就像你给小孩示范如何扔球一样,你扔几次球来教他如何做,然后通过观看那些样例,他开始学会自己扔球了。 每一个训练实例通常表示为一组固定的属性或特征。特征是用来表示每一个实例的方式。例如,在案例1中,一张图片可以由每个像素的灰度级别来表示。在案例2中,推文可以用推文中出现的字词来表示。在案例3中,信用记录可以用此人的年龄、薪水、职业等来表示。 计算和选择合理的特征来表示一个实例是使用机器学习的过程中最重要的任务之一,在本文稍后部分我们将讨论这点 |
|广告服务|关于我们|Archiver|手机版|小黑屋|大数据人 ( 鄂ICP备14012176号-2 )
GMT+8, 2024-11-21 22:22 , Processed in 0.184871 second(s), 21 queries .
Powered by 小雄! X3.2
© 2014-2020 bigdataer Inc.