本篇文章4248字,读完约11分钟
&CTO梁坤,数学和美国的联合创始人:无处不在的机器学习和人工智能 人工智能和机器学习,这两个不常见的科技术语,现在正在广泛传播。在过去的10年里,机器学习给我们带来了无人驾驶汽车、实用的语音识别、有效的网络搜索,并大大加深了我们对人类基因组的理解。 人工智能和机器学习,这两个不常见的科技术语,现在正在广泛传播。在过去的10年里,机器学习给我们带来了无人驾驶汽车、实用的语音识别、有效的网络搜索,并大大加深了我们对人类基因组的理解。什么是机器学习?机器学习能做什么?企业机器学习的应用趋势是什么?美国首席技术官梁坤在第五届中国大数据应用论坛上分享了他对人工智能主题的理解。以下是他演讲的内容。
演讲嘉宾:梁坤,CTO,美日联合创始人,高考状元,北京大学学霸。他曾经为百度工作。小米曾担任高级工程师和建筑师。他两次获得百度MVE(最有价值员工)。他成功地将大数据应用于搜索推荐、反欺诈、风险控制等领域。凭借大数据解决方案的整体架构能力。擅长发现和解决用户在大数据领域的痛点。
首先,我想自我介绍一下。我是梁坤,数字美国的联合创始人和首席技术官。我很荣幸有机会介绍机器学习和人工智能。本演示分为三个部分:
第一部分,什么是机器学习
第二部分,机器学习能做什么
第三部分是企业机器学习的应用趋势。
什么是机器学习
引入机器学习的一个方面是从机器学习的目标或者企业需要做什么来引入。机器学习最大的分支是计算机科学,其中之一是人工智能。人工智能中实现人工智能有两种方法。这两种方法分别对应人类智能的两种思维方式。一种思维模式叫做演绎方法,这意味着我从已知的规则和事实中演绎出新的规则和事实。这个系统在20世纪60年代和80年代使用得更频繁,被称为专家系统。人类的第二种思维叫做归纳,它通过对事实的观察和归纳,总结出新的规律和新事物的本质,然后应用于新事物。这现在被称为计算中的机器学习。当然,近年来非常热门的机器学习方法叫做深度学习,这是机器学习的一个领域。
计算机科学从1994年开始发展。它在干什么?其本质是试图实现业务自动化。当我第一次出来的时候,我的目标完全是数值计算。大规模的计算是非常困难的,如果我不得不依靠人来做的话,需要大量的精力和时间。机器能被做成流水线计算吗?这是最早的计算。我们不断探索,不仅数据计算的自动化,而且普通企业各行业的流程和业务都在信息化和自动化。这是关于订单转移、企业资源规划财务等的自动化。数据库出现后。随着计算机变得越来越流行,越来越多的事情可以自动化。互联网自动化了许多事情,比如数据的检索。当我们进一步扩大自动化的范围时,我们发现了一些困难。例如,自动驾驶汽车非常困难。因为计算机本质上是一个程序,它需要明确的指令,在第一步做什么,在第二步做什么,然后才能完成它。然而,自动驾驶汽车不能用明确的说明来描述,因为这个过程非常复杂。
另一个非常经典的问题是,有一只小猫,即使是三岁的孩子也很容易识别,但是编写一个程序让计算机系统知道是非常复杂的。
因此,第二个分支,人工智能,被提议智能自动化非常复杂的问题或业务。为什么称之为智能自动化?因为用一个明确的公式或算法一步一步来做是非常困难的。我们需要这个系统能够观察世界,像人一样思考,做出明智和理性的决定,并最大化目标。例如,我想开一辆车,在最短的时间内到达目的地,不发生任何事故。这是人工智能。人工智能是利用类人智能来制造简单的程序,在机器学习中不能自动化。
人工智能在工业中有两种方法,一种是演绎法。该方法的核心概念是专家将已知的知识和推理规则融入其中。当新的情况发生时,系统将根据已知的知识推导出新的规则。例如,大楼里有火灾探测器。事实上,这是一个非常简单的专家系统。它只知道一个事实。当温度达到一定高度时,就会开始冒烟。这个系统的一个优点是它只需要专家的支持,而不需要太多的数据。商业系统就是我们所说的机器学习。
感应。这时,没有专家告诉他推理的规则,而是给了他大量的数据,这就是对世界的描述。然后会有一个算法,不管是神经网络算法还是其他算法,算法本身就是观察数据、探索数据,它会自动根据统计规则从数据中总结出一些规则和事实。当一个新的数据进入时,它可以被应用到它。机器学习本身仍然自动化复杂的业务系统。
深度学习是机器学习的一个分支。我们可以估计点击率,这是互联网购买利润的两个核心之一。当一个用户来的时候,我应该给他什么样的广告,这个用户最有可能订购这个广告来让我赚钱。深度学习解决的是对世界做出更抽象的解释。例如,传统的方法不能形成多层次的抽象。深度学习是不同的。深度学习只是给他一幅画。深度学习主要基于神经网络。神经网络的第一层正在学习这张图片或脸部角落的特征。例如,眼睛的概念与某些特征相结合,鼻子的概念与某些特征相结合,有没有弧或阴影?进一步说,这个神经网络将形成一个非常高层次的抽象,这是一张人脸。这个先进的概念对我们来说是很自然的,但是对计算机来说,你很难准确地描述它。
例如,关于马的概念,我们可以看到有各种各样的马,白马,黑马或一些少了一条腿的马,甚至是玩具马或木马。当我们把这个东西放在你面前时,每个人都清楚地知道这是一匹马。但是当你想描述一台机器时,马的概念是极其复杂的。你很难描述它。两只耳朵,四条腿,能跑的是马吗?不,这是需要通过深入研究来解决的问题。希望通过深入研究,计算机能够理解只有人才能够理解的高级概念。
深入研究在过去的两年里非常流行,但事实上这个概念已经存在了很长时间。银行在20世纪70年代开始使用它。现在它已经演变成深入学习。银行预测个人信用评分。如收入、年龄、消费构成、职业、预计产出按期还款概率或延期还款概率等。
机器学习在今天变得越来越重要。为什么?由于多年来的高度信息化和低存储成本,大量的数据出现在我们的存储和计算机世界中,这是由于广泛的互联网化。这样,就有机会使用更复杂的机器学习算法,因为它有很多事实和数据需要学习。这是归纳,取决于这个条件。因此,过去两年的发展非常迅速。
机器学习能做什么?
算术交易、欺诈检测和信用评估都是非常经典的应用,都是可以预测的东西。我提出了前两个,前两个是从去年到今天整个互联网行业最赚钱的两个算法。一个是在线广告,它贯穿整个电脑。如果你打开任何网页,你会发现这些广告。一些广告商直接与网站签署交付协议,但更多的是通过JD.com和淘宝这样的中介。当你投放广告时,只有当用户点击广告时,广告商才会付费。所以当广告出现在这个页面上时,你必须把他最有可能订购的广告放在上面。这涉及到非常复杂的事情。这涉及到所有方面,包括你必须创建一个用户的肖像,你必须知道你的用户,性别,年龄,住在什么地区和什么地区。第二个是个性化推荐,我相信大家都很熟悉。在互联网上,我们每个人都在享受定制服务。你正在听音乐,它会把你感兴趣的音乐推向你。如果你看看今天的头条,他会把你感兴趣的新闻推给你。当然,还有算法交易、欺诈检测、信用评估等等。例如,我们的员工可以实时检测一个人是真人还是机器人。此外,机器人现在非常先进。他们都互相交谈。
新兴应用如何?机器学习实际上可以做很多事情。我选了几个非常令人震惊的例子,比如实时翻译,一个路标,如果你把相机对准它,它会给你实时翻译成你知道的语言。另一个例子是微软的软件,它是同声传译。他所要做的就是说英语。他说的话被实时翻译成中文。当他听到你说的话时,会实时翻译成英语。这件事让我非常震惊。因为我的一个大学同学学习同声传译。那时,他学习非常努力,但是现在机器可以做到。一两年前,自动驾驶仪还处于试验阶段,但今天它已经开始上路了。第一个真正在路上跑的人。包括特斯拉、谷歌和百度。相信自动驾驶将成为未来中高档汽车的标准。为什么今天能做到这一点?非常简单,因为特斯拉拥有数亿英里的驾驶数据。
从刚才的几个例子中,让我们想象机器学习可以深入生活的各个方面。金融、制造、机器人工厂、医疗、教育、服务等方面。为什么?因为机器学习或基于机器学习的人工智能,其最基本的目标是在某项任务中像人类一样聪明,并且能够像人类一样分析这个问题并做出快速预测。在我看来,机器学习将成为其他方面的核心。
企业机器学习的应用趋势
让我们来看看谷歌的数据,在2002年谷歌部署了机器学习模型,几十个,或者100出头。但是到2016年初,他们将部署近3000个机器学习模型。在他的每一项业务中,Gmail、阅读、翻译等等。部署了机器学习。事实上,许多公司,尤其是早期的互联网公司,都在追随这一趋势。在我看来,几乎所有的大型企业都会在几年内被机器学习自动处理,几乎所有的企业都是如此。我添加它几乎只是为了精确,因为它可能是全部。首先,随着商业的广泛数字化和互联网,工业4.0和互联网plus已经在人们的食品、服装、住房和交通的所有方面进行了数字化和基于互联网的商业。这会导致什么?这将导致我们拥有大量的数据。包括出租车数据、膳食数据、服装数据、医疗数据等。与此同时,存储和计算成本不断下降。几年后,每个企业都将成为数据企业,并积累自己的核心数据,这是非常宝贵的财富。因为这些数据提供了机器学习和人工智能的基石。
其次,这些数据不能只是陈述。每个企业都将大规模地部署机器学习,以在自己的企业中自动化尽可能多的大型企业。什么可以被机器学习所取代,为什么不呢,所以每个企业都将机器学习应用于其核心业务。当然,机器学习仍然是一件非常麻烦的事情。对于强大的大型企业,他们可以建立自己的专家团队和机器学习团队来提供定制服务。然而,这是一个富人的游戏,不适用于普通企业。现在,亚马逊、微软和阿里正在整合标准学习模块和共享行业信息模块。在我看来,中小型企业也将部署机器学习模型,但他们所拥有的不是定制的,而是基于云的机器学习。它就像应用标准服务一样使用。第三,每个企业提供的每个应用程序服务都是智能的,这不再意味着我需要昂贵的成本来定制服务。每个客户都在享受定制服务和定制应用。这是未来两三年企业机器学习应用的趋势分析。当然,如果不能在三年内完成,可能需要五年时间。
我的介绍到此结束,谢谢!
Sumei是一家由顶级大数据专家团队在一线互联网上创建的大数据企业。由顶级互联网领导者领导的大数据企业依靠积累的海量数据和核心技术来提供领先的大数据风力控制产品和服务。目前,它已经为数百名客户提供服务,涵盖直播、金融、支付、社交网络、电子商务、游戏、O2O等行业。
标题:&CTO梁坤,数学和美国的联合创始人:无处不在的机器学习和人工智能
地址:http://www.yunqingbao.cn/yqbxx/2344.html