Tuesday, February 03, 2015

[repost ]深度学习引爆下一次科技革命

original:http://ift.tt/16rxAH0 摘要 : 深度学习不仅是人工智能的发动机,更是其他众多领域、甚至是整个社会科技进步的动力。 百度首席科学家吴恩达在今天百家BIG TALK硅谷活动上提到,从优秀产品到大量用户,再到海量数据,最后返回优秀产品是一个良性循环,但最后一个环节“海量数据到优秀产品”会出现问题,因为当数据积累过多时,就无法对这些数据进行完整和准确的处理,从而也无法为优秀产品的后续更新提供参考。直到深度学习出现才改善了这种局面,他把数据比作火箭的燃料,把深度学习比作发动机,是深度学习将数据这种燃料点燃从而将人工智能推到另外一个高度。而值得一提的是,在今天BIG TALK以及其他活动的演讲中,各领域专家都直接或间接的提到了深度学习。所以,我大胆的得出一个结论,深度学习不仅是人工智能的发动机,更是其他众多领域、甚至是整个社会科技进步的动力。 1、 深度学习的定义 传统人工智能的机器学习是通过标记数据进行有监督学习,随着其所需处理数据量的增大,外界对其的支持和帮助也就更大,而且计算结果的准确性也会受到影响。因此,对于这种传统算法,越来越多的数据将成为负担,也更容易达到极限或产生错误结果。但深度学习是从未经标记的数据展开学习,这更接近人脑的学习方式,可以通过训练之后自行掌握概念。面对海量数据,深度学习算法可以做到传统人工智能算法无法做到的事情,而且输出结果会随着数据处理量的增大而更加准确。这将大幅度提高计算机处理信息的效率。同时,深度学习在加速回归定律的指引下会使得进化过程中产物(输出结果)获得指数级增长,当深度学习的效率变得更高,就会吸引更多的资源向它聚合,使其发展更为迅速。王威廉在《国际机器学习大会ICML2013参会感想》提到:“用半监督或无监督学习方法挖掘无标签的数据,不仅是过去10年,还很可能是大数据时代的一个热点。 回到“海量数据到优秀产品”这一环节,这些数据处理效率的指数级增长其实是来源于我们对互联网产品的每一次微小的使用以及相应的每次数据的贡献,而这些汇集起来的数据再借助深度学习算法就会为会我们输出更加准确的结果,提供更好的服务,其产生的效果也会像滚雪球一样越来越大。这就是吴恩达在今天的讲座中提到的深度学习所促成的完整流程,也是他之前提到的人工智能正循环。 而深度学习带来的正循环不仅体现在人工智能领域,还体现在机器人技术、信息化医疗、社会物理学和能源问题等领域。 2、 深度学习对大数据的价值 如吴恩达所言,数据是人工智能的燃料。随着各个行业信息化程度的普及,任何行业所积累的数据会越来越多,但当真正面对海量数据时,各行业才意识到数据处理能力远远不够。在今天上午参观百度美国研究院时,百度高级技术总监吕厚昌提到了深度学习对大数据的重要性,他认为,此前在数据的数量和效率之间存在矛盾,收集更多的数据有助于提高最终结果的准确性,但数据越多,处理起来就越慢。当没有足够高效的处理工具时,大数据就变成了数据坟墓,即使这些数据再大,也无法提取出任何价值,因为没办法对其进行高效处理,这也违背了我们收集数据的初衷。 深度学习的出现就是解决了如何快速处理海量数据的问题,拿百度举例,吕厚昌说,百度的数据处理自上而下分成开放云、数据工厂和百度大脑三个层级,最底层的开放云收集数据,数据工厂对数据库进行管理,最上层百度大脑的模拟神经网络通过机器学习高效的输出结果,从而实现行业应用。深度学习就是在最后一个环节体现出巨大价值,带来更好的信息处理能力,从而产生更加广泛和深入的行业应用,比如百度大数据此前在医疗、交通和金融领域的应用。 此外,MIT人类动力实验室主任Alex Pentland的社会物理学就是基于大数据对人类的各种社会行为进行分析,从而得出结论并提供决策依据;伯克利大学能源专家Daniel Kammen也是基于大数据来解决气候变迁这个宏大的人类课题。这两个领域都需要有海量数据支撑,因此,拥有高效、良性处理能力的深度学习技术就显得尤为重要。 大数据已经变成各个行业的基础架构,而真正能帮助这些行业处理好数据,并最终实现具体应用的还是因为深度学习的出现。可以说,深度学习是大数据具体行业应用的必要工具。 3、 深度学习对机器人领域的价值 康纳尔大学创意机器人实验室主任Hod Lipson讲述了他研发的基于“元认知(Metacognition)”的机器人,他们事先没有对这些机器人的行为进行编程,而是让这些机器人更加自由的活动,对机器人的行为和“进化”进行研究,从而建造出能够具备自我学习能力和进化能力的机器人。TED对此进行了非常准确的描述:Hod Lipson及团队在创造一种能够决定自己如何走路的机器人;一种能够开发出自我感觉的机器人;通过不断试错,最终构建出“更像自己”的机器人。在技术哲学层面,Hod Lipson借鉴了美国知名人工智能专家、认知科学家Marvin Lee Minsky的理论,机器的大脑有两层结构,一层感知外部世界,一层感知自身,以此在虚拟和现实之间帮助机器构建出一个对自我意识的认识和思考,也就是他今天提到的“对思考进行思考”,从而让机器具有“自我”。思想家I.J.古德提到,机器设计是智能机器的能力之一,而Hod Lipson现在所做的就是在培养机器的这种“设计能力”。 Hod Lipson认为他现在之所以能够制造出拥有“自我意识”的机器人,原因有两个,第一是他一直推崇的3D打印技术的出现。第二就是深度学习技术的成熟,他对该领域保持关注了十多年,直到今天,深度神经网络的训练才达到令人满意的效果,拥有自我意识和学习能力的机器人才会出现。 深度学习赐予了Hod Lipson更加智能的机器人,那这对我们来说意味着什么?Hod Lipson认为这可以应用在医疗行业,因为具有意识的机器人能更好的了解人类的感受,从而对病人进行更好护理。他提到的这种应用已经实现,去年,欧盟发布了RoboEarth项目,四个机器人在模拟医院的环境中相互协作来照顾病人,它们通过与云端服务器的交互来进行信息共享和互相学习。例如,一个机器人可以对医院房间进行扫描并将完成的地图上传至RoboEarth,而另外一个对这个房间完全不了解的机器人就可以通过访问云端的这张地图来找到房间中一杯水,而不需要再进行额外的搜索。 这不仅体现了这种智能机器人在医疗行业的重要性,更预示着智能将从机器群组中涌现。不论是Hod Lipson的机器人,RoboEarth体系里的单个机器人,还是此前MIT发布的“多智能体系统”和哈佛大学的“白蚁机器人”,它们都是Robert Chambers在《Vestige of The Natural History of Creation》中变化论(transmutation)提到的“早期简单形态的物种”。而这种初期形态会逐渐向高级形态进行自然进化,这种法则可以被定义成单个个体的适应性,一种在群体中诞生并不断增长的学习能力。就像一只看不见的手,一只存在于大量低级成员中却控制并引导着整体的手,直到量变引起质变。更难得的是,机器的这种学习能力是有加速度的,随着时间推移,进化能力本身的多样性、复杂性和进化力也随之增长,这就是KK在《失控》里提到的群组的自我进化。 4、 深度学习对信息医疗领域的价值 斯坦福大学教授Walter Greenleaf的演讲是信息医疗,全球老龄化的加剧带来了严重的医疗负担,在过去的31年间,医疗开销超过了经济增长。而目前解决这个问题的最佳途径就是医疗信息化和数字诊断,移动智能设备的普及,医疗设备的数字化和便携式、云计算、社交化都在加速这个目标的达成,而当这一切都变成数字化时,医疗其实就变成了一个数据处理的过程,但数据量将会出现爆发式增长,越来越多的人加入,体征监测指标越来越多,服务层级也越来越丰富,这就需要深度学习来提供强大的数据处理能力。同时,由于机器在处理病情时可以做到完全按照数据处理结果进行客观诊断,而不像人类一样因为情感方面的原因做出错误判断,因此,医疗领域的发展也需要人工智能和深度学习的有力支持。 百度的大数据引擎把医疗行业作为重点应用方向,去年6月份上线的疾病预测可以对全国331个地级市,2870个区县的四种疾病进行未来趋势的预测,其中,百度的深度学习技术势必发挥了重要作用。IBM 和纽约基因中心 New York Genome Center, NYGC 合作,利用超级计算机的运算能力加速脑癌研究并找到最佳的治疗方法;Watson […]



via WordPress http://ift.tt/16rxAH6

Labels:

0 Comments:

Post a Comment

<< Home