AI和ML

万物非联(连)网就会有智慧,你不容错过的智能核心-机器学习

字号+ 作者:Vincent Ke 来源:progressbar 2018-02-05 12:27

有联网这件事情,绝对不是构成"服务"的要件之一,所有的感应装置永远在做的就是数据上的搜集和处理,但如何把Data转换成information和Knowledge,这中间的关键要素就是在现在另外一个火红的项目"机器学习



 

根据英国 IT Jobs Watch、Indeed 和 Stack Overflow 等三大机构统计中,不管是从人力职缺上还是薪资待遇,2018年http://www.iothome.com/' target='_blank'>联网绝对是不容小觑的一个趋势,在上一篇文章里我们已经为各位介绍了物联网的基本架构,但只有联网这件事情,绝对不是构成"服务"的要件之一,所有的感应装置永远在做的就是数据上的搜集和处理,但如何把Data转换成information和Knowledge,这中间的关键要素就是在现在另外一个火红的项目"机器学习(Machine learning,ML)"

首先,ML的价值是什么呢?大家都知道现在物联网的应用非常广泛,比如像是用扫描仪扫描会员Barcode去纪录消费,或是智能冰箱、智能空调等等,都是物联网的实用案例,从感应装置传送到管理平台,结合应用程序的处理、分析,并在反馈出决策指引装置做应用等,但关键点就在所谓的决策段了,也就是所谓的"决策支持"系统,那这和一般的数据分析有什么不同呢?

传统的数据分析在解释数据这方面的确是相当称职的一件事情,你可以利用过去的事件,来推估一样的状况发生在现在时,会发生什么样的状况,也就是一种历史的概念,比如像是一间餐厅,因为百分之80的用餐者都回复说好吃,其中女性又占七成,那我们可以判断这是一间适合女性用餐的餐厅,对吧?这就是利用过去的数据来做分析模型的一种判断,找出目标变量的相关性,来推测结果,也就是所谓的Data Mining

而这样分析的精准度当然就会取决在所谓的分析数据量上啰,简单来说,越多人说餐厅好吃,那这间好吃的可性度自然就会高啰,以电子商务的应用为例,大部分的男性购买衣服时身高超过180的都买L号,而且退货率小于20%时,就代表你应该身高只要过180,选L号绝对正确吧!如果每一台新闻气象都说明天下雨机率90%,那我想明天应该就会下雨吧?

当然,你可以依照过去发生的事件,以及影响变因去做交叉比对,在把今天发生的情况加入比对之中,来对接下来的使用行为做出判断,并依据每一次的决策去做纪录,但这样的数据分析通常是静态的,在处理快速变化和非结构化的数据面来说,使用程度是相当有限的,就像你把字汇都建进翻译机之后,把句子KEY进去做翻译,通常翻出来的东西很难做实时修正吧,特别是那种新兴的专有名词,如果没办法动态的捕捉这些词汇,那翻译出来的精准度一定会有所落差。

这点在物联网也是一样,因为数据写入的感应装置数量很多,并且可以和数以万计的外部因素去做动态关联,那静态模型若是无法自我扩充的话,决策就会有失准的可能。

难道百分之八十的人评断说好吃的店一定好吃吗? 会不会是有促销活动的影响呢? 还是其他因素的关联? 难道大家都说会下雨,明天就不会事情天吗?

所以在传统的数据分析上,除了这些过去数据辅佐外,还会导入一些专家的决策做背书,并建立模型与数据变量之间做关联。而机器学习是从变量(例如节能)出发,然后自动寻找预测变量及其相互作用,并去对模型做修正。

最简单的一个实例就是我们常用的Google翻译了,GOOGLE利用手边庞大混乱的语汇数据集。并将其翻译系统母体大至全球,广达数十亿个翻译网页来训练计算机,其中的数据报含公司网站、多语系的国际报告、多语系的使用文件、说明书..等等,透过这样的方式来提升翻译的精准度,来预判出现"Good"之后,下一个英文字是"JOB"或是"Morning" 的机率有多高。

数据源包含各公司网站、官方文件的多语翻译,国际组织的多语报告,或是 Google 图书扫描计划,纳入的书籍翻译,甚至包含网上各种断简残篇、质量参差不齐、混乱的数据。这样一来,翻译的准确度再度提升,甚至某个英文字之后,出现另外一个字的机率,都能够计算出来,并透过回馈让翻译模型成长,变得更精准。

而目前的ML主要有两大类别如下:

1、监督式学习 (Supervised learning):指在一组实例的基础上开发一种算法。例如智慧雨伞贩卖为例,可能是一个产品每天的销售记录。比方说雨伞在一天之中可以卖几支,并推算何时可以自动补货

2、非监督式学习 (Unsupervised Learning):结合其他数据,让系统主动分析并探索销售的关键因素,而非单纯的日期与销售的关系,例如下雨天造成雨伞的销售影响状况、是否会有本地事件(例如抗议用伞当象征道具..等),来做出雨伞销售量与这些因素关联的关系。

若是以智能家电为例呢?其物联网数据分析的来源数据可能包含如震动,环境因素如温度、语言、文字、影像辨识,或是用户行为等在线的数据,并结合一些开源数据做辅助,如天气温湿度、新闻等做交互使用,都是一些很好的例子 ,利如智能冷气可以判断使用者的习惯,并结合室内外温,来做几度就会开冷气的决策支援;而智能冰箱可以依据使用者的采买习惯来了解青菜吃几周会吃完..等等。

所以物联网的数据分析及决策支持中,有几个关键要素如下:

1、大量数据并导入专家的评判做关联,让数据库变成知识库,并导入自动化的规则来汇整应用

2、对数据做分析后抓取数个关键变量,以及变量特征,

3、导入机器学习,结合算法来验证模型的精准度,将字动结果回馈到预测过程中的参数中,来达优化预测和决策支持

但无论如何,一个好的物联网并非是靠人为去做数据决策支持,而是应该要透过更系统化、更自动化的方式来让产品的决策更为精准,而物联网本身的价值并非只是在搜集数据,而是如何把数据变成服务,甚至是应用方案,才应该是物联网的核心。







 

相关文章
  • 2020年值得关注的6个机器学习用例

    2020年值得关注的6个机器学习用例

    2020-02-07 21:30

  • 了解不同类型的聊天机器人

    了解不同类型的聊天机器人

    2020-02-01 21:01

  • 机器人的崛起:新技术改变传统行业

    机器人的崛起:新技术改变传统行业

    2020-01-12 22:43

  • 利用计算机视觉和机器学习进行智能回收

    利用计算机视觉和机器学习进行智能回收

    2019-10-31 14:17