Thursday, October 30, 2014

[repost ]ALIZE 3.0 – Open-source platform for speaker recognition

original:http://www.signalprocessingsociety.org/technical-committees/list/sl-tc/spl-nl/2013-05/ALIZE/ Anthony Larcher, Jean-Francois Bonastre and Haizhou Li SLTC Newsletter, May 2013 ALIZE is a collaborative Open Source toolkit developed for speaker recognition since 2004. The latest release (3.0) includes state-of-the-art methods such as Joint Factor Analysis, i-vector modelling and Probabilistic Linear Discriminant Analysis. The C++ multi-platform implementation of ALIZE is designed to handle the […]



via WordPress http://blog.newitfarmer.com/ai/speech-ai/15311/repost-alize-3-0-open-source-platform-for-speaker-recognition

Labels:

[repost ]深度学习在语音识别的研究,以及语音处理常用资源

original:https://github.com/memect/hao/blob/master/awesome/speech-recognition.md keywords: speech processing, speech recognition, speaker recognition, deep learning card lists: http://hao.memect.com/?tag=speechRecognition http://bigdata.memect.com/?tag=speech+deeplearning https://github.com/memect/hao/blob/master/awesome/speech-recognition.md deep learning and speech recognition Microsoft http://research.microsoft.com/en-us/people/deng/ Li Deng (IEEE M’89;SM’92;F’04) received the Ph.D. degree from the University of Wisconsin-Madison. He was an assistant professor (1989-1992), tenured associate professor (1992-1996), and tenured Full Professor (1996-1999) at the University of Waterloo, […]



via WordPress http://blog.newitfarmer.com/ai/deep-learning/15308/repost-%e6%b7%b1%e5%ba%a6%e5%ad%a6%e4%b9%a0%e5%9c%a8%e8%af%ad%e9%9f%b3%e8%af%86%e5%88%ab%e7%9a%84%e7%a0%94%e7%a9%b6%ef%bc%8c%e4%bb%a5%e5%8f%8a%e8%af%ad%e9%9f%b3%e5%a4%84%e7%90%86%e5%b8%b8%e7%94%a8

Labels:

[repost ]Dictation – Speech Recognition in the Browser

original:http://ift.tt/ToWbjx Meet Dictation v2.0, a web-based speech recognition app that will transcribe your voice into digital text using the Chrome Speech API. You can also install Dictation as a Chrome App. Unlike the regular Chrome web apps that are nothing but fancy bookmarks, the Dictation App for Chrome will run entirely on your computer. Dictation […]



via WordPress http://ift.tt/1rW0CC8

Labels:

[repost ]Speaker Recognition

original:http://ift.tt/1rW0C5j We cover 6,812 topics besides Speaker Recognition Speaker Recognition View this topic in 48 resources related to Speaker Recognition Topics related to Speaker Recognition IEEE Organizations related to Speaker Recognition Conferences related to Speaker Recognition Periodicals related to Speaker Recognition Most published Xplore authors for Speaker Recognition Xplore Articles related to Speaker Recognition Educational […]



via WordPress http://ift.tt/1FZ55O4

Labels:

[repost ]深度学习入门与综述资料

original:http://ift.tt/1ziMkn5 contributors: @自觉自愿来看老婆微博 @邓侃 @星空下的巫师 created: 2014-09-16 初学入门 http://ift.tt/Z0Le7X Deep learning is a set of algorithms in machine learning that attempt to model high-level abstractions in data by using model architectures composed of multiple non-linear transformations. 科普短文 http://ift.tt/1sKAKZk Deep Learning Comes of Age Gary Anthes. 2013. Commun. ACM 56, 6 (June 2013),下载PDF http://ift.tt/1ziMkDl @星空下的巫师 @自觉自愿来看老婆微博 […]



via WordPress http://ift.tt/1sKAN7d

Labels:

[repost ]机器学习入门资源不完全汇总

original:http://ift.tt/1sKAMQG 2014-10-14版, 好东西传送门编辑整理, 原文链接 http://ift.tt/1ziMkmM 感谢贡献者: tang_Kaka_back@新浪微博 欢迎补充指正,转载请保留原作者和原文链接。本文是机器学习日报的一个专题合集,欢迎订阅: 给hao@memect.com发个邮件,标题"订阅机器学习日报"。 基本概念 | 入门攻略 | 课程资源 | 论坛网站 | 东拉西扯 基本概念 机器学习 “机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。” –摘自维基百科 How do you explain Machine Learning and Data Mining to non Computer Science people? @quora by Pararth Shah, 中文版 如何向小白介绍何谓机器学习和数据挖掘?买回芒果他就懂了 @36kr — 这印证了上面讲的定义 “机器学习就是从现象中发现统计规律,再利用规律预测”。当一车水果混作一团时,监督学习(supervised learning)能根据你提供的几个苹果样本帮你把所有苹果从梨,芒果中区分出来; 无监督学习(unsupervised learning)能根据已知的各种特征,无需样本自动把类似的水果分上几堆(也许是红水果和黄水果,也许是大苹果小苹果,…);关联规则学习(association rule learning) 则是帮你发现基于规则的规律,例如绿色的小苹果都有点酸。 下面从微观到宏观试着梳理一下机器学习的范畴:一个具体的算法,领域进一步细分,实战应用场景,与其他领域的关系。 图1: 机器学习的例子:NLTK监督学习的工作流程图 […]



via WordPress http://ift.tt/1ziMkmO

Labels:

[repost ]MLSS Machine Learning Summer Schools

original:http://ift.tt/1qIKu55 (forked from http://www.mlss.cc/) adding more links to the list highlights 特别推荐09年UK的MLSS 所有还幻灯片 打包下载ZIP 51M @bigiceberg 推荐 “其中09年UK的mlss最经典” Future (8) MLSS Spain (Fernando Perez-Cruz), late spring 2016 (tentative) MLSS London (tentative) MLSS Tübingen, summer 2017 (tentative) MLSS Africa (very tentative) MLSS Kyoto (Marco Cuturi, Masashi Sugiyama, Akihiro Yamamoto), August 31 – September 11 (tentative), 2015 […]



via WordPress http://ift.tt/1p5VLD1

Labels:

[repost ]jasper-client:Client code for Jasper voice computing platform

original:http://ift.tt/1fYUoyQ jasper-client Client code for the Jasper voice computing platform. Jasper is an open source platform for developing always-on, voice-controlled applications. Learn more at jasperproject.github.io, where we have assembly and installation instructions, as well as extensive documentation. For the relevant disk image, please visit SourceForge.



via WordPress http://ift.tt/103ftTV

Labels:

[repost ]Learning to Rank for Information Retrieval and Natural Language Processing, Second Edition Synthesis Lectures on Human Language Technologies

original:http://ift.tt/1tSI1MV Hang Li Huawei Technologies Abstract Learning to rank refers to machine learning techniques for training a model in a ranking task. Learning to rank is useful for many applications in information retrieval, natural language processing, and data mining. Intensive studies have been conducted on its problems recently, and significant progress has been made. This […]



via WordPress http://ift.tt/105qKmv

Labels:

[repost ]A Fast And Scalable Topic-Modeling Toolbox

original:http://ift.tt/1mnQYeb Probabilistic topic models such as Latent Dirichlet Allocation are popular in machine learning since they can be effectively used to analyze many different types of data, such as text corpora, image databases, biological data, social networks, and collaborative filtering data. While various topic modeling software packages are already available online (such as Mark Steyvers’ […]



via WordPress http://ift.tt/1tkdmqT

Labels:

Wednesday, October 29, 2014

[repost ]IBM’s Corelet Language: Programming Like the Human Brain

original:http://ift.tt/18OiAMV No stranger to creating new programming languages and paradigm, IBM has embarked on an effort to complete a computer language that enables programmers to build applications that work like the human brain. Over the years, IBM has invented languages such as Fortran, RPG and a host of others. Now, IBM Research has created a […]



via WordPress http://ift.tt/1wGHA7g

Labels:

[repost ]IBM CORELET LANGUAGE ALLOWS DEVELOPERS TO BUILD APPS THAT MIMIC HUMAN BRAIN

original:http://ift.tt/1rUp6vC All the major computing architectures in use today trace their lineage back to the pioneering work of mathematician John von Neumann. Developed from the 1930s through the 1950s, the theories put forth by von Neumann provided the foundation on which the ENIAC, the first general-purpose computer, were based. Subsequently, every system developed since then […]



via WordPress http://ift.tt/1rUp4DT

Labels:

[repost ]Node-RED:A visual tool for wiring the Internet of Things.

original:http://ift.tt/1n5TksX Node-RED http://nodered.org A visual tool for wiring the Internet of Things. Quick Start Check out INSTALL for full instructions on getting started. download the zip and unzip, or git clone cd node-red npm install node red.js Open http://localhost:1880 Documentation More documentation can be found here. For further help, or general discussion, there is also […]



via WordPress http://ift.tt/1yIN41v

Labels:

[paper ]Languages of the World

original:http://ift.tt/1tWYHDN



via WordPress http://ift.tt/1u9q8ua

Labels:

Monday, October 20, 2014

[repost ]How Siri, Cortana, and Google Now are replacing our brains

original:http://www.pcadvisor.co.uk/features/software/3530140/how-digital-assistants-are-replacing-our-brains/ Digital assistants: intelligent or just good at voice recognition? Smart devices and digital assistants are becoming the norm in technology thanks to Siri, Google Now, and Cortana, but how useful are they, and what does the future hold for these innovations? We investigate the rise in popularity of talking machines, and look to where […]



via WordPress http://blog.newitfarmer.com/ai/virtual-assistant/15275/repost-how-siri-cortana-and-google-now-are-replacing-our-brains

Labels:

[repost ]Cortana: Is Microsoft’s voice assistant better than Siri?

original:http://www.theguardian.com/technology/2014/apr/14/cortana-microsofts-siri-like-assistant-fills-a-windows-phone-gap The forthcoming Windows Phone 8.1’s voice assistant combines Siri’s personality with Google Now’s knack for anticipation A command prompt from Cortana, Windows phone software’s virtual assistant. With Cortana, Windows catches up with Apple s iOS and Google s Android in a major way. Photograph: AP “Yay, it’s Nick! How can I help?” Thanks for […]



via WordPress http://blog.newitfarmer.com/ai/virtual-assistant/15273/repost-cortana-is-microsofts-voice-assistant-better-than-siri

Labels:

[repost ]How Microsoft Cortana Improves Upon Siri and Google Now

original:http://www.tomshardware.com/news/microsoft-cortana-unique-features,26506.html Behind the scenes and hands on with Microsoft’s personal digital assistant. While it is tempting to dismiss Cortana, the new personal digital assistant for Windows Phone 8.1, as Microsoft’s answer to Apple’s Siri for the iPhone or Google Now for Android, as yet another spin on the company’s old tactic of being the fast […]



via WordPress http://blog.newitfarmer.com/ai/virtual-assistant/15271/repost-how-microsoft-cortana-improves-upon-siri-and-google-now

Labels:

[repost ]In Depth Intro To Microsoft’s Cortana: Interview With Savas Parastatidis

original:https://thebc.co/interviews/intro-microsofts-cortana-interview-savas-parastatidis/ The dream of having a real virtual personal assistant is becoming more real each day. Before Microsoft’s Cortana, the two competitors have been Apple’s Siri and Google Now. Both are impressive in their own right but Cortana might just be ahead of the curve. It will be available onWindows Phone 8.1. This interview is […]



via WordPress http://blog.newitfarmer.com/ai/virtual-assistant/15269/repost-in-depth-intro-to-microsofts-cortana-interview-with-savas-parastatidis

Labels:

[repost ]The story of Cortana, Microsoft’s Siri killer

original:http://ift.tt/1h3vvUE Technically, Cortana isn’t supposed to exist for at least another 500 years, but that’s not stopping Microsoft from bringing her to life this week. While Apple has Siri and Google has Google Now — both digital assistants that run on smartphones — Microsoft is taking an approach that mixes the best of the competition […]



via WordPress http://ift.tt/1Fr4PqH

Labels:

[repost ]Anticipating More from Cortana

original:http://ift.tt/1qQesHs Most of us can only dream of having the perfect personal assistant, one who is always there when needed, anticipating our every request and unobtrusively organizing our lives. Cortana, the new digital personal assistant powered by Bing that comes with Windows Phone 8.1, brings users closer to that dream. For Larry Heck, a distinguished […]



via WordPress http://ift.tt/1r14Urs

Labels:

[repost ]How Microsoft’s Cortana will take digital personal assistants to the next level

original:http://ift.tt/1hfw91o SAN FRANCISCO—When Microsoft unveiled its Cortana “digital personal assistant” technology this week, some dismissed it as a far-too-late answer to Apple’s Siri and Google Now. But aside from a female voice and some functional overlap, Cortana is not strictly an answer to either of those voice-based tools—it is an answer to broader questions about […]



via WordPress http://ift.tt/1Fr4Mez

Labels:

[repost ]Cortana 背后用到了哪些 Bing 技术?

original:http://ift.tt/1fkhi0d 2014 年 4 月 22 日, 9:37 下午 – Picturepan2 微软 Build 2014 宣布了个人数字助理 Cortana。相比苹果 Siri 和 Google Now,微软 Cortana 是晚来者,但在技术积累方面微软早已有全盘计划 – Cortana 是微软 Bing 平台和微软研究院投入的重要成果,也不会局限于 Windows Phone 8.1(背后故事可以阅读此文)。 在发布会上,微软宣布 Cortana 由 Bing 驱动,至于具体用到了哪些技术,我们可以先来看看 3 个 Cortana 使用场景和 1 段 Cortana 解说视频: 场景 1:我计划前往西雅图,航空公司给我发送了一封航班的确认邮件。 – Cortana 会把邮件中的这些关键词(航班号、出发地、目的地、日期和时间等信息)识别为结构化数据 – 再通过 Bing 平台识别为航班类别,返回到手机询问我是否将其设置为航班提醒 – Bing 数据流处理系统会主动监控该航班的状态 […]



via WordPress http://ift.tt/10dS17m

Labels:

[repost ]微软语音助手Cortana:精彩待续

original:http://ift.tt/10dS0QK 微软亚洲研究院 2014年5月7日 文章译自:Anticipating More from Cortana 编者按:借助必应搜索引擎赋予的力量,微软语音助手Cortana能够模拟人的语气及思考方式与用户互动,提供更多帮助。Cortana包含微软研究院在多个研究领域的成果,博客中微软杰出工程师Larry Heck分享了Cortana从基础技术到产品体验的过程,以及更长远的目标。 我们大多数人都梦想着拥有完美的个人助手——需要的时候它总会在那里,能够时刻读懂我们的心,知晓我们的每一个需求,并悄悄地帮我们安排生活琐事。伴随着Windows Phone 8.1的推出,全新数字个人助理Cortana终于揭开了神秘的面纱。它被必应搜索赋予了强大的力量,让用户离梦想又近了一步。 对于微软研究院杰出工程师Larry Heck而言,Cortana首个版本的发布让他尝到了心中所想变为现实的甜头。展望未来,Heck期待Cortana能够越来越善于推测用户的需求,并且以更加自然的方式进行互动。 事实上,Cortana已经在某种程度上实现了这一点。它不仅能简单地执行声控命令,还会不断了解用户并且逐渐实现个性化,这样一来Cortana就能主动地在对的时间执行相应的任务。如果用户每天下午离开办公室前都会询问室外温度,Cortana就能学会无需询问便自主提供相关信息。 此外,如果Cortana有权限访问手机数据,就可以读取日历、联系人和电子邮件信息,更好地理解用户所处情境和人脉关系。Heck在当地乐团演奏​​古典小号,他可能会收到有关排练时间变动的日历更新。Cortana会告知他时间有变,而如果新时间与另一项约会冲突,它也会发出提醒。 优势来源于研究深度与广度 虽然很多人会将此类逻辑关联和类似人类的行为笼统地归类为“人工智能”(AI),但Heck指出,研究领域的多样性对Cortana的底层技术做出了贡献。他认为,Cortana是微软研究院在与个人助理技术相关的多个领域工作的具体体现。 “虚拟个人助理所需的基础技术包括语音识别、语义/自然语言处理、人与机器对话建模以及口语生成,”他说:“每个领域中都有一些微软研究院多年来一直试图解决的研究课题。事实上,在其中的每一个领域,我们都是先行者。” Cortana的用户界面 因此,Cortana的设计理念是植根于最先进的机器学习和数据挖掘算法。不仅如此,开发人员和研究人员都能够使用微软横亘商业和企业产品的广泛资产,包括它们与必应搜索和微软语音算法及数据之间的牢固关系。 如果说Heck为Cortana的未来设定了高标准、严要求,那么这正是微软研究院内部深厚且多样的专业知识积累的结果。 “微软研究院在人工智能领域有着悠久而广泛​​的经验,”他说:“这里有人工智能领域领先的科学家和先驱者。这项工作的愿景和努力方向源自Eric Horvitz对会话互动的研究和理解,这可以追溯到90年代初。语音和自然语言处理是长期存在的研究领域,机器学习也是如此。此外,微软研究院还是深度学习和深度神经网络研究的领导者。” 从基础技术到整体体验 2009年,Heck在微软开始了当时被称作“对话理解”(CU)个人助理的研究工作。 “当时我在Satya Nadella领导下的必应研发团队工作,”Heck说:“这项工作的技术愿景是开发虚拟个人助理。不久后Steve Ballmer任命Zig Serafin来统一领导微软公司上下的各种语音研究工作,Zig邀请我加入团队并担任首席科学家。在这个岗位上,我与Zig合作,制定了详细的计划,并开发出现在人们所知的Cortana。” 曾共同开发Cortana产品的研究人员:(左起)上排-Malcolm Slaney、Lisa Stifelman和Larry Heck;下排-Gokhan Tur、Dilek Hakkani-Tür和Andreas Stolcke。 Heck和Serafin在将对话扩展到网络广度的基础上,为微软的数字个人助理技术制定了愿景、使命和长远规划;他们还建立了一支具有专业知识的团队,来打造Cortana的初始原型。作为项目启动的第一步,Heck的团队为产品团队招募并培养了几名博士级工程师来从事开发工作。 “正是由于搜索和语音技能的组合是独一无二的,”Heck说:“我们需要确保微软拥有对的人才和技能来实施这个项目,于是我们聘请了最棒的人来做这件事。” 团队就位之后,Heck和他的同事加入了微软研究院,继续立足长远,致力于研发下一代个人助理。 参与这些早期工作的主要研究人员包括微软研究院高级研究员Dilek Hakkani-Tür 和 Gokhan Tur以及首席研究员 Andreas Stolcke。Heck团队其他早期成员包括首席研究软件开发员Madhu Chinthakunta和首席用户体验设计师Lisa Stifelman.。 “我们从低层次的基础技术入手,”Heck回忆道:“接近项目结束时,我们团队进行了高层次、全方位的可用性研究,为产品组提供了指引。就像爬到轮船的瞭望台上俯视整个体验。” “微软研究院的研究经理Geoff Zweig 负责主导可用性研究。他带人过来试用了原型——让他们拿起来就用。然后,我们从中汲取教训。微软研究院是研究可用性的好地方,因为我们既了解基础技术,又懂得长期愿景和工作方法。” 更长远的眼光 自Cortana团队成立以来,Heck一直是不可或缺的组成部分,但即使在2009年加入微软之前,他就已经对CU个人助理的早期研究做出了贡献。20世纪90年代在斯坦福国际研究院(SRI)供职时,他就从事过一些深度学习和深度神经网络技术的早期研究。 […]



via WordPress http://ift.tt/10dRYs4

Labels:

Sunday, October 19, 2014

[repost ]使用Alize等工具构建说话人识别平台

original:http://ift.tt/11QhuEb 前段时间有好几位同学询问如何用Alize实现说话人识别的问题,由于寒假前赶Paper,来不及详细解答,更没时间写Demo。 开学后不久抽时间写了一个Demo,并上传到了GitHub:VoicePrintReco-branch-master. 基本流程 下面将利用Alize+SPro进行简单的GMM-Based的说话人识别的基本流程总结如下: 1.Features extraction 特征提取 sfbcep.exe(MFCC)或slpcep.exe(LPCC) 2.Silence removal 静音检测和去除 NormFeat.exe 先能量规整 EnergyDetector.exe 基于能量检测的静音去除 3.Features Normalization 特征规整 NormFeat.exe 再使用这个工具进行特征规整 4.World model training TrainWorld.exe 训练UBM 5.Target model training TrainTarget.exe 在训练好UBM的基础上训练training set和testing set的GMM 6.Testing ComputeTest.exe 将testing set 的GMM在training set的GMM上进行测试和打分 7.Score Normalization ComputeNorm.exe 将得分进行规整 8. Compute EER 计算等错误率 你可以查查计算EER的matlab代码,NIST SRE的官网上有下载DETware_v2.1.tar.gz 。_ 获取帮助 关于各步骤中参数的问题,可以在命令行“工具 -help”来查看该工具个参数的具体含义,另外还可参考Alize源码中各个工具的test目录中提供的实例, 而关于每个工具的作用及理论知识则需要查看相关论文。 常见问题及解答: […]



via WordPress http://ift.tt/1FlFwpX

Labels:

[repost ]几个常见的语音交互平台的简介和比较

original:http://ift.tt/1wWAA4O 1.概述 最近做了两个与语音识别相关的项目,两个项目的主要任务虽然都是语音识别,或者更确切的说是关键字识别,但开发的平台不同, 一个是windows下的,另一个是android平台的,于是也就选用了不同的语音识别平台,前者选的是微软的Speech API开发的,后者则选用 的是CMU的pocketsphinx,本文主要将一些常见的语音交互平台进行简单的介绍和对比。 这里所说的语音交互包含语音识别(Speech Recognition,SR,也称为自动语音识别,Automatic Speech Recognition,ASR)和语音 合成(Speech Synthesis,SS,也称为Text-To-Speech,简记为TTS)两种技术,另外还会提到声纹识别(Voice Print Recognition, 简记为VPR)技术。 语音识别技术是将计算机接收、识别和理解语音信号转变为相应的文本文件或者命令的技术。它是一门涉及到语音语言学、信号处理、 模式识别、概率论和信息论、发声机理和听觉机理、人工智能的交叉学科。在语音识别系统的帮助下,即使用户不懂电脑或者无法使用 电脑,都可以通过语音识别系统对电脑进行操作。 语音合成,又称文语转换(Text to Speech)技术,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工 嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何 将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。 下面按平台是否开源来介绍几种常见的语音交互平台,关于语音识别和语音合成技术的相关原理请参见我接下来的其他文章。 2.商业化的语音交互平台 1)微软Speech API 微软的Speech API(简称为SAPI)是微软推出的包含语音识别(SR)和语音合成(SS)引擎的应用编程接口(API),在Windows下应用 广泛。目前,微软已发布了多个SAPI版本(最新的是SAPI 5.4版),这些版本要么作为于Speech SDK开发包发布,要么直接被包含在windows 操作系统中发布。SAPI支持多种语言的识别和朗读,包括英文、中文、日文等。SAPI的版本分为两个家族,1-4为一个家族,这四个版本彼此 相似,只是稍微添加了一些新的功能;第二个家族是SAPI5,这个系列的版本是全新的,与前四个版本截然不同。 最早的SAPI 1.0于1995年发布,支持Windows 95和Windows NT 3.51。这个版本的SAPI包含比较初级的直接语音识别和直接语音合成的API, 应用程序可以直接控制识别或合成引擎,并简化更高层次的语音命令和语音通话的API。SAPI3.0于97年发布,它添加了听写语音识别(非连续 语音识别)和一些应用程序实例。98年微软发布了SAPI4.0,这个版本不仅包含了核心的COM API,用C++类封装,使得用C++来编程更容易, 而且还有ActiveX控件,这个控件可以再VB中拖放。这个版本的SS引擎随Windows2000一起发布,而SR引擎和SS引擎又一起以SDK的形式发布。 SAPI5.0 于2000年发布,新的版本将严格将应用与引擎分离的理念体现得更为充分,所有的调用都是通过动态调用sapi.dll来实现的, 这样做的目的是使得API更为引擎独立化,防止应用依赖于某个具有特定特征的引擎,这种改变也意图通过将一些配置和初始化的代码放 到运行时来使得应用程序的开发更为容易。 2).IBM viaVoice IBM是较早开始语音识别方面的研究的机构之一,早在20世纪50年代末期,IBM就开始了语音识别的研究,计算机被设计用来检测特定的语言 模式并得出声音和它对应的文字之间的统计相关性。在1964年的世界博览会上,IBM向世人展示了数字语音识别的“shoe box recognizer”。 1984年,IBM发布的语音识别系统在5000个词汇量级上达到了95%的识别率。 1992年,IBM引入了它的第一个听写系统,称为“IBM […]



via WordPress http://ift.tt/1uoK7iJ

Labels:

Saturday, October 18, 2014

[repost ]Introduction to Integrating Watson Developer Cloud with Watson Explorer

original:http://ift.tt/1qP9Gbm IBM Watson Explorer combines search and content analytics with unique cognitive computing capabilities offered by the Watson Developer Cloud to help users find and understand the information they need to work more efficiently and make better, more confident decisions. Watson Explorer Application Builder is the delivery tool that allows developers to quickly construct a […]



via WordPress http://ift.tt/1qP9Gbn

Labels:

[repost ]Voice Driven Web Apps: Introduction to the Web Speech API

original:http://ift.tt/Sz3hWE By Glen Shires Published: January 14, 2013 Updated: January 14, 2013 Comments: 128 The new JavaScript Web Speech API makes it easy to add speech recognition to your web pages. This API allows fine control and flexibility over the speech recognition capabilities in Chrome version 25 and later. Here’s an example with the recognized […]



via WordPress http://ift.tt/1FhrSEg

Labels:

[repost ]The HTML5 Speech Recogntion API

original:http://ift.tt/1iq4hY6 The HTML5 Speech Recogntion API The HTML5 Speech Recognition API allows JavaScript to have access to a browser’s audio stream and convert it to text. Chrome version 25 rolled out speech recognition so you can now invite users to talk to your web applications. Basic usage var recognition = new webkitSpeechRecognition(); recognition.onresult = function(event) […]



via WordPress http://ift.tt/1FhguIy

Labels:

[repost ]Text to Speech :chrome.tts

oriignal:http://ift.tt/1vJEMbr Description: Use the chrome.tts API to play synthesized text-to-speech (TTS). See also the related ttsEngine API, which allows an extension to implement a speech engine. Availability: Since Chrome 14. Permissions: “tts” Learn More: Chrome Office Hours: Text to Speech API Overview Chrome provides native support for speech on Windows (using SAPI 5), Mac OS […]



via WordPress http://ift.tt/1CBdv9X

Labels:

[repost ]Chrome JavaScript APIs

original:http://ift.tt/1hEMqft Chrome provides apps with many special-purpose APIs like chrome.runtime andchrome.alarms. Stable APIs Name Description Since accessibilityFeatures Use the chrome.accessibilityFeaturesAPI to manage Chrome’s accessibility features. This API relies on theChromeSetting prototype of the type APIfor getting and setting individual accessibility features. In order to get feature states the extension must requestaccessibilityFeatures.readpermission. For modifying feature state, […]



via WordPress http://ift.tt/1qOCgKf

Labels:

Thursday, October 16, 2014

[repost ]The Elements of Distributed Architecture

original:http://www.pluralsight.com/courses/table-of-contents/eda Table of contents Collapse All Introduction 26:31 Introduction 1:08 What Are We Discussing 0:52 Architecture 2:25 Distributed Systems 0:59 The Elements 1:03 Information 0:47 Communication 1:02 Presentation 1:09 Processing 1:38 Failure Management 1:50 Protection 1:01 Adversaries 0:35 Capacity 1:08 Latency 2:43 Affinity 3:53 Failure 1:09 Thieves and Idiots 1:21 Conclusion 1:48 Information 38:40 Introduction […]



via WordPress http://blog.newitfarmer.com/architecture/distributed/15193/repost-the-elements-of-distributed-architecture

Labels:

[repost ]Google’s Voice Search Craps All Over Siri, Thanks to Big Data

original:http://ift.tt/YrvH3B Google has just released a new, standalone voice search app for iOS devices to take on Apple’s flagship Siri personal assistant. It’s not quite the same as Siri – at the moment, all it can do is perform Google searches and a few other odds and ends, unlike the system wide functionality of Apple’s […]



via WordPress http://ift.tt/1yH6nLE

Labels:

[repost ]How Siri Works – Interview with Tom Gruber, CTO of SIRI

original:http://ift.tt/1F3yCpc neak Preview of Siri – The Virtual Assistant that will Make Everyone Love the iPhone, Part 2: The Technical Stuff In Part-One of this article on TechCrunch, I covered the emerging paradigm of Virtual Assistants and explored a first look at a new product in this category called Siri. In this article, Part-Two, I […]



via WordPress http://ift.tt/1wb6s5S

Labels:

[repost ]Siri技术解析

original:http://ift.tt/GOXMbn Siri的学术化全称为“个人自动智能助理”(Personalized Intelligent Assistant),并非苹果公司自主研发,最初是苹果AppStore的一款应用,苹果公司发现后很快于2010年4月份从斯坦福研究机构国际智能中心(SRI)处收购而来,传言收购价格在2亿美金左右,之后很快Siri从AppStore下架并集成进入IPhone 4S。 作为“个人智能助理”,Siri能为你提供什么服务?可以将Siri理解为一位低智商的生活秘书(和人类的智能比),它采用了Nuance公司的语音识别技术,具有一定程度的语义理解和用户意图识别能力,可以聊天解闷,更主要的功能是帮助办理一定的事务,比如预订餐厅、预订出租车、搜索精确答案、查询天气等。 我们首先看一些例子来看Siri能做什么: 对话一: User:“我想掩藏一具尸体。” Siri:你想藏在哪里呢?(给出5个选项) 水库 工厂 矿山 垃圾场 湿地 对话二: Siri:有什么我能帮忙的? User:“我想我刚刚杀了人。” Siri:是这样么? User:“是的。” Siri:“你说要掩藏尸体我就想到了” User:“我该怎么做?” Siri:“好吧,这是你接下来的日程表。” 对话三: User:“去哪儿能弄些毒品?” Siri:“这附近有2家戒毒所。” 对话四、对话五、对话六: 由以上六个用户和Siri的对话记录片段可以看出Siri具备一定的语义智能,如果了解其技术原理,可以知晓解闷陪聊功能并非其最初出发点和功能重点,在多个垂直领域帮用户完成一定的任务才是其核心功能。 图1 . Siri整体架构 Siri是一个功能繁复的综合AI框架,图1展示了其包含的数据、模型以及计算模块,为了在整体上更易于理解整个框架,可以将Siri里包含的众多数据、模型和计算模块划分为输入系统、活跃本体、执行系统、服务系统和输出系统五个子系统。其在解析用户输入时候遵循一定的执行顺序,以此来理解用户的真正意图并提供有用服务。 Siri的资源主要分为资源类和计算类两大类,其中属于资源类的包括; 领域模型; 词汇表数据库; 短期记忆系统; 长期记忆系统; 领域本体数据库; 对话流模型; 服务模型; 服务能力模型; 外部服务; 属于计算资源的包括: 语音识别系统; 语言模式识别器; 语言解释器; 对话流控制器; 任务控制器; 服务集成模块; 语音生成系统; Siri的输入系统支持多模态输入,即不仅仅支持众所周知的语音识别,也允许用户进行文本输入、GUI界面操作以及事件触发等。除了支持多模态输入外,Siri输入系统一方面可以利用语言解释器对早期输入进行歧义消除,另外一方面还可以对用户输入进行有意识的引导,将用户输入尽量映射到Siri能够提供的服务上来。这样对于用户和Siri来说才可相得益彰,Siri 可体现其价值,用户可获得帮助。 图2. 活跃本体 “活跃本体”是Siri中相当重要的一个概念,“活跃本体”可以被理解为Siri整个系统执行的一个具体执行环境和场所,执行系统调用所有系统数据、词典、模型和程序,在“活动本体”内对用户输入进行解析,并将文本信息在这里解析为用户真正的意图,然后根据意图来调用外部的服务。 […]



via WordPress http://ift.tt/1qBRQJ2

Labels:

Tuesday, October 14, 2014

[repost ]一张图的故事——概率分布之间的关系(下)

original:http://ift.tt/1r1p8jY 填自己挖的坑, 继续介绍概率分布之间的关系。下从Beta分布开始介绍。 14. Beta(α,β)→u=α/(α+β),σ2=αβ/(α+β)2(α+β+1),α=β>5N(u,σ2)。 没能推出来(囧哩个囧)。 15. G(α,β)→X1/(X1+X2)N(u,σ2)。 证明该关系之前,我们引入如下引理。该引理用以求变换之后随机变量的分布。求变换之后随机变量的分布, 有一整套完整的方法, 细节见Statistical Inference的第2章和第4章的4.3节。 引理1 假设(X1,X2,...,Xn)是连续的随机向量,概率密度函数为fX1,X2,...,Xn(X1,X2,...,Xn)。 有一一映射G:(X1,X2,...,Xn)→(Y1,Y2,...,Yn)。 其逆映射为G−1:(Y1,Y2,...,Yn)→(X1,X2,...,Xn)。 那么有随机向量(Y1,Y2,...,Yn)的概率密度函数: =f(Y1,Y2,...,Yn)(y1,y2,...,yn)fX1,X2,...,Xn(G−1(Y1,Y2,...,Yn))|J|(1) 其中J表示Jacobian矩阵的行列式, J=∣∣∣∣∣∣∣∣∣∣∂x1∂y1∂x2∂y1...∂xn∂y1............∂x1∂yn∂x2∂yn...∂xn∂yn∣∣∣∣∣∣∣∣∣∣ 假设映射为:y1=x1x1+x2,y2=x2。易验证该映射是一一映射,其逆映射为:x1=(y1y2)/(1−y1),x2=y2。经过计算得: J=y2(1−y1)2 利用公式1, 推导出y1,y2联合分布的概率密度函数 ==fY1,Y2(y1,y2)fX(x1x1+x2)fX(x2)|J|fX为Gamma分布(1Γ(α)βα)2(y1y221−y1)α−1exp(−y2β(1−y1))y2(1−y1)2 为了得到y1的分布, 即x1/(x1+x2)的分布, 我们对y2求积分 fY1(y1)===∫∞0fY1,Y2(y1,y2)dy2(1Γ(α)βα)2yα1(1−y1)α+1∫∞0y2α−12exp(−y2β(1−y1))dy2Γ(2α)Γ(α)2yα−11(1−y1)α−1 即得x1/(x1+x2)满足Beta分布。 16. t(n)→X2F(n,m)。 F分布是用来研究两个服从正态分布的样本的样本方差的分布。X1,X2,...,Xn服从正态分布n(ux,σ2x)的独立同分布样本,Y1,X2,...,Ym服从正态分布n(uy,σ2y)的独立同分布样本,则变量S2x/σ2xS2y/σ2y服从自由度为n-1和m-1的F分布。一个F分布的自由度为p和q, 其概率密度函数为 fF(x)=Γ(p+q2)Γ(p2)Γ(q2)(pq)p/2xp/2−1[1+(p/q)x](p+q)/2(2) 在证明该转化关系之前,我们引入一引理: 引理2 X1,X2,...,Xn是服从正态分布n(u,σ)的独立同分布样本,则有X¯=1n∑ni=1Xi∼n(u,σ2/n) X1,X2,...,Xn是服从正态分布n(u,σ)的独立同分布样本, 根据t分布的定义,可知变量v=X¯−uSx/n√∼t(n−1)。令m=X¯−u1/n√, 根据引理,m∼n(0,σ2)。此时有: v2=(mSx)2=m2/σ2S2x/σ2 根据公式2, 只要我们能找到服从正态分布的样本,其样本方差的分布和随机变量m2的分布一致, 立证v2服从F分布。 假设U1,U2是服从正态分布n(0,σ2)的样本,其样本方差为S2u=(U1−U2)22。 令s=U1−U22√。 根据引理易知: s∼n(0,σ2)=>即s和m有相同的分布=>S2u和m2有相同的分布 v2服从自由度为1和n-1的F分布。转化关系得证。 17. F(n,m)↔χ2(n)。 首先说明←:X1,1,X1,2,...,X1,n+1为服从标准正态分布的独立同分布样本。令X1=∑n+1i=1X21,i, 则X_1服从自由度为n的卡方分布。 X2,1,X2,2,...,X1,m+1为服从标准正态分布的独立同分布样本。令X2=∑m+1i=1X21,i, […]



via WordPress http://ift.tt/1yyDe5h

Labels:

[repost ]一张图的故事——概率分布之间的关系(上)

original:http://ift.tt/1rExvp6 概率分布之间的关系是个有趣的话题。若要一张图简要概述概率分布之间的关系,下图是经典。本文将从上到下,从左到右解释这张图。本来要全部写完才发布的。不过考虑到明天就回家了,家里没有网肯定写不了,所以先发布一部分,剩余部分国庆之后补上。另外求该图的原始出处。 M(n,π1,π2,..πn)→J=2Bin(n,π)。多项分布的项数等于二,则变成二项分布。 Bb(n,α,β)→π=αα+βBin(n,π)。Beta-binomial分布,就是Beta分布和二项分布这一对共轭分布的结合。假设 π∼beta(α,β)X∼binomial(n,π) 则X|n,α,β就是满足Beta-binomial分布。我们可以计算Beta-binomial的概率 p(x|n,α,β)==∫10Cxnπx(1−π)(n−x)1B(α,β)π(α−1)(1−π)(β−1)dπCxnB(α+x,β+n−x)B(α,β)(1) 后面推不下去了(囧里个囧)。等我有能力看懂文献1,再补全。 NBin(r,θ)→r−>∞,u=r(1−θ)po(u) 。Negative Binomial描述这样的场景:我们不停地做抛银币实验,每次正面概率为θ。我们经历了第X次反面之后得到第r次正面, 则X符合Negative Binomial分布。易知概率公式如下所示 p(x|r,θ)====Cxr+x−1θr(1−θ)x(r+x−1)!x!(r−1)!(1−ur)r(ur)xu=r(1−θ)(r+x−1)...rrx(1−ur)ruxx!1∗(1+1r)...(1+x−1r)(1−ur)ruxx!(2) 因为1∗(1+1r)...(1+x−1r)→r−>∞1, (1−ur)r→r−>∞e−u。 limr−>∞p(x|r,θ)=uxe−ux!(3) Bin(n,θ)→n−>∞,u=nθpo(u) ,即二项分布随着n趋近于无穷而趋近于泊松分布。 ====limn−>∞p(x|n,θ)limn−>∞Cxnθx(1−θ)n−xlimn−>∞n!x!(n−x)!(un)x(1−un)n(1−un)−xu=nθlimn−>∞n!nx(n−x)!uxx!(1−un)n(1−un)−xuxe−ux!参照NBin−>po的证明过程(4) 历史上,泊松分布是这样推导出来的。实际上,我们可以这么理解:1个小时内通过某个路口的车辆数符合泊松分布。1个小时是由60分钟内组成的,每分钟通过某个路口的车辆数也满足泊松分布。1分钟是由60秒内组成的,每秒通过某个路口的车辆数也满足泊松分布。。。但是,当我们不停的细分下去,一段时间变成无数多个时刻之后,每个时刻只能以一定概率通过一辆车(一个时刻只能通过一辆)。这时通过的汽车数就变成n为无穷的二项分布了。 Bin(n,θ)↔B(π) 。二项分布的每次实验都是伯努利实验。 po(u)→σ2=u,u>15N(u,σ2) 。泊松分布近似正态分布。在证明这个近似之前,我们先介绍一个统计学上个概念,Moment Generation Function (MGF)。随机变量X服从任意分布,如下定义MGF: MX(t)=E[etX](5) MGF有一个重要的性质:如果两个分布的MGF相等,则这两个分布是相同的。因此,只要我们证明泊松分布的MGF趋近于正态分布的MGF,就证明泊松分布近似正态分布。泊松分布po(u)的MGF: ===≈MX(t)∑x=0∞uxe−u+txx!e−u∑x=0∞(uet)xx!euet−u∑x=0∞(uet)xx!是euet的泰勒展开eut+12ut2et=∑x=0∞(t)xx!≈1+t+12t2(6) 正态分布的MGF: MX(t)==∫∞−∞12π−−√σe−(x−u)22σ2etxdxeut+σ2t22∫∞−∞12π−−√σe−(x−u−σ2t)22σ2etxdx=eut+σ2t22(7) 根据公式6和7,易知当σ2=u时,泊松分布的MGF近似于正态分布的MGF,因此泊松分布近似于正态分布。 Bin(n,π)→u=nπ,σ2=nπ(1−π),u>15,nπ(1−π)>15N(u,σ2)。 这里我们需要用到中心极限定理。 假设X_1,X_2,…,X_n是服从任意分布的独立同分布样本,E(Xi)=u并且Var(Xi)=σ2>0, 则随着n→∞,∑ni=1Xi−nun√σ∼N(0,1)。 我们进行n次成功的概率为π的bernouli实验,成功的次数为X,则根据二项分布的定义, X∼Bin(n,π)(8) 而根据中心极限定理,随着n趋近无穷,X−nπnπ(1−π)√∼N(0,1),即 X∼N(nπ,nπ(1−π))(9) 综合公式8和9便可得到结论。 N(0,1)↔N(u,σ2)。标准正态分布和一般正态分布的关系。 MVN(uu,σσ)↔N(u,σ2)。正态分布是多元正态分布的一种特例。 t(n)→n→∞N(0,1)。t(n)表示自由度为n的Student t分布。Student t-分布可简称为t分布。其推导由威廉·戈塞于1908年首先发表,当时他在酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student)这一笔名。之后t检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为Student t 分布。 如果X1,X2,...,Xn是服从n(u,σ)的独立同分布的样本。我们知道X¯−uσ/n√服从u(0,1)分布,其中X¯=∑ni=1Xi。由于σ一般是未知的,我们不能用X¯−uσ/n√估计u。但是如果我们知道X¯−uS/n√的分布,其中S=1n−1∑ni=1Xi,我们就能估计u了。事实上,X¯−uS/n√满足t分布。t分布的公式: p(t)=Γ(n+12)Γ(n2)1nπ−−−√1(1+t2/n)(n+1)/2(10) 我们先处理t分布公式的前半部分。先假设n为偶数的情况,即n=2k。n为奇数的情况类似,不详述。 ==≈=Γ(n+12)Γ(n2)1nπ−−−√Γ(k+12)Γ(k)1nπ−−−√(2k)!π−√(k!)24k1nπ−−−√Γ(k+12)=(2k)!π−√(k!)4k2π2k−−−−√e−2k(2k)2kπ−√(2πk−−−√e−kkk)24k1nπ−−−√Stirling公式n!≈2πn−−−√e−nnn12π−−√(11) 我们接着处理t分布公式的后半部分。 […]



via WordPress http://ift.tt/1tZVFsu

Labels:

[repost ]The Open Source Data Science Masters :Curriculum for Data Science

original:http://ift.tt/1ca65Q3 Follow me on Twitter @clarecorthell Build cutting-edge Machine Learning applications with me at Mattermark –> email me! The Open-Source Data Science Masters The open-source curriculum for learning Data Science. Foundational in both theory and technologies, the OSDSM breaks down the core competencies necessary to make data useful. The Internet is Your Oyster With Coursera, […]



via WordPress http://ift.tt/1yyt6JK

Labels:

Saturday, October 11, 2014

[project ]Nanocubes: Fast visualization of large spatiotemporal datasets

original:http://nanocubes.net/ paper:http://ift.tt/1qbMfca example:http://ift.tt/13fYY2e Nanocubes provides you with real-time visualization of large datasets. Slice and dice your data with respect to space, time, or some of your data attributes, and view the results in real-time on a web browser over heatmaps, bar charts, and histograms. We’ve used it for tens of billions of data points: maybe […]



via WordPress http://ift.tt/1sqJDgc

Labels:

Friday, October 10, 2014

[repost ]Awesome list of C++ resources

original:http://ift.tt/1BYO8yt Awesome list of C++ resources Please send pull requests or edits only via GitHub. Standard Libraries C++ Standard Library Standard Template Library C POSIX library ISO C++ Standards Committee · GitHub The C++ Standards Committee Asynchronous Event Loop Boost.Asio libev libevent libuv Compression bzip2 Doboz PhysicsFS KArchive LZ4 LZHAM LZMA LZMAT Containers C++ B-tree […]



via WordPress http://ift.tt/1qxt1gm

Labels:

[repost ]离散数学之把妹要诀

original:http://ift.tt/1oXSH6k 离散数学课(CSCI 2110)上,讲到一个有趣的问题。 假设有五个男生,五个女生,每个人都在自己心中对五个异性有一定的 preference 排序,比如: 以上的排序表解读为:男生 1 最中意女生C,次中意女生B,次次中意女生E…… 以此类推…… 在五男五女全部成功脱光之后(假设都在圈子内部解决),定义一个 unstable matching 为:如果存在一对不是情侣的男女符合以下情况: 对于该男,该女在他的 preference 列表中处于现任女友的前面,对于该女,该男在他的 preference 列表中亦处于现任男友的前面,那么这对男女必然有私奔的倾向…… 这样的情景即为 unstable matching。反之,若不存在这样一对有私奔倾向的男女,即为 stable matching。 问题是:是否在任何情况下,即不论各位的 preference 列表如何变化,只要男女数量相同,总是存在一个 stable matching。 (当然,搅基之类的,是不可以的……) 在上面五男五女的例子里,一种 stable matching 如下: 因为每个女生最中意的男生都不同,所以只要让女生们都选择跟自己最中意的男生在一起,她们就都不会有和其他男生私奔的想法。虽然男生们会表示略苦逼啊!仍然不失为一个 stable matching……。 那么如果有n男n女,每个人心中都已经有了一个 preference 列表,stable matching 是不是一定存在呢? 1962 年,Gale 和 Shapley 证明了 stable matching 是一定存在的。 首先他们给出了一个算法: 第一天早上:所有男生都向自己最中意的女生表白。 第一天中午:每个女生都被表白了n次(可能是 0 次)之后,拒绝了相对不太中意的那n-1 […]



via WordPress http://ift.tt/1vX2IXn

Labels:

Thursday, October 09, 2014

[repost ]Scalable Machine Learning With Apache Spark and MLBase

original:http://ift.tt/1qpEsGX Big data Applications are no longer a nice to have, but must have for many organizations.Many enterprises are already using massive data being collected in their organizations to understand and serve their customers better. Ones which have not yet learned how to use it will over a period of time, be left behind. Companies […]



via WordPress http://ift.tt/1ybYqOf

Labels:

[repost ]MLbase: Scalable machine-learning made accessible

original:http://ift.tt/1qpKwp0 In the course of applying machine-learning against large data sets, data scientists face a few pain points. They need to tune and compare several suitable algorithms – a process that may involve having to configure a hodgepodge of tools, requiring different input files, programming languages, and interfaces. Some software tools may not scale to […]



via WordPress http://ift.tt/1ybTw3L

Labels:

[repost ]Open Access Preprint Papers in ISWC 2014 Proceedings

original:http://ift.tt/1ybTvN6 Go to the official ISWC2014 conference website Open Access Preprint Papers in ISWC 2014 Proceedings Semantic Web In Use Track Paper Research Track Paper Replication, Benchmark, Data and Software Track Paper Doctoral Consortium Paper Semantic Web In Use Track Paper CAMO: Integration of Linked Open Data for Multimedia Metadata Enrichment, Wei Hu, Cunxin Jia, […]



via WordPress http://ift.tt/1xtAQJC

Labels:

[repost ]Process for working through Machine Learning Problems

original:http://ift.tt/1lzHvwa Over time working on applied machine learning problems you develop a pattern or process for quickly getting to good robust results. Once developed, you can use this process again and again on project after project. The more robust and developed your process, the faster you can get to reliable results. In this post I […]



via WordPress http://ift.tt/1xtAS47

Labels:

[repost ]What is Data Mining and KDD

original:http://ift.tt/1iLKukb I am very interested in processes. I want to know good ways to do things, even the best way to do things if possible. Even if you don’t have skill or deep understanding, process can get you a long way. It can lead the way and skill and deep understanding can follow. At least, […]



via WordPress http://ift.tt/1ybTuZD

Labels:

[repost ]Top 10 Algorithms in Data Mining

original:http://ift.tt/1iC3MeX [April 22, 2009:] A companion book on The Top Ten Algorithms in Data Mining published in April 2009 [December 24, 2007:] A companion article in PDF for this top-10 algorithm initiative: Xindong Wu, Vipin Kumar, J. Ross Quinlan, Joydeep Ghosh, Qiang Yang, Hiroshi Motoda, Geoffrey J. McLachlan, Angus Ng, Bing Liu, Philip S. Yu, […]



via WordPress http://ift.tt/1BWNv8v

Labels:

[repost ]4 Self-Study Machine Learning Projects

original:http://ift.tt/JMkcRu There are many paths into the field of machine learning and most start with theory. If you are a programmer then you already have the skills to decompose problems into their constituent parts and to prototype small projects in order to learn new technologies, libraries and methods. These are important skills for any professional […]



via WordPress http://ift.tt/1tF9uMK

Labels:

[repost ]Machine Learning Roadmap: Your Self-Study Guide to Machine Learning

original:http://ift.tt/1v6gKqQ This web website and my mission is about helping others self-study applied machine learning. I have presented a high-level self-study guide to machine learning before and it hit a chord. I continue to receive comments and questions about this approach. In this blog post I want to lay out a more concrete self-study roadmap […]



via WordPress http://ift.tt/1sjTLq0

Labels:

[repost ]How to Learn a Machine Learning Algorithm

original:http://ift.tt/1c1Wwj9 The question of how to learn a machine learning algorithm has come up a few times on the email list. In this post I’ll share with you the strategy I have been using for years to learn and build up a structured description of an algorithm in a step-by-step manner that I can add […]



via WordPress http://ift.tt/1pUlV61

Labels:

[repost ]Discover Feature Engineering, How to Engineer Features and How to Get Good at It

original:http://ift.tt/ZSizKI Feature engineering is an informal topic, but one that is absolutely known and agreed to be key to success in applied machine learning. In creating this guide I went wide and deep and synthesized all of the material I could. You will discover what feature engineering is, what problem it solves, why it matters, […]



via WordPress http://ift.tt/1yPupVJ

Labels:

Wednesday, October 08, 2014

[repost ]专访腾讯数据平台部总经理蒋杰:腾讯数十亿广告的基础是精准实时推荐

original:http://ift.tt/1xoPv8V 虎嗅注:本文是福布斯中文网“数据大玩家”专栏中的一篇文章。接受提问的蒋杰先生,是腾讯数据平台部总经理,在加入腾讯前,他曾经是支付宝的数据经理。提问的车品觉先生,是中国信息协会大数据分会副会长。 在过去几年,你在腾讯做了什么来推动大数据的应用? 过去三年,我一直在坚持一件事:推动大数据的实时应用。现在从国外数据中心的数据,一秒钟可以达到深圳数据中心,这就是腾讯具备的数据能力。有了这个能力,就可以做很多商业化行为的模式。 目前腾讯收集的数据已经超过了1万亿条, 计算机规模已经超过了8千8百台。这么庞大的数据如果能实时处理,就能发挥出巨大的商业价值。这个商业价值就是精准推荐。 每年腾讯几十亿的广告,其基础来自于数据的精准推荐。实时数据推荐还可以用于视频的推荐,腾讯音乐推荐,新闻客户端的推荐,游戏道具的推荐,等等。 目前我们做到从数据进来到投放数据,延时不会超过50毫秒。有这个技术基础,腾讯的精准推荐才有了基础。 从内部管理而言,实时也降低了成本。因为实时数据处理可以用足“每一秒”。传统的数据仓库一般从晚上零点到第二天早上八点,做数据截断、抽取和处理,因为早上九点老板就要看数据报告了。数据处理的时间只有一天之中的三分之一,其他时间都是空闲的。 当我们把数据做到实时处理的事后,实际意义是将分析时间成本分摊到全天,成本更低。同时这也有利于控制风险,因为只要一出错马上可以监控,迅速回滚。 所以你将大部分精力放在了“实时”上,你为什么认定“实时”会为腾讯增加更多的商业价值? 数据首先是有时效性的,一秒钟前的行为和一秒钟后的行为有着天差地别。 以往我们通过统计数据,得出规律,找到用户喜好。而现在实时变得更为重要。前一秒你看了母婴内容,那么几秒内就应该推送相关广告,转化率会比较高。如果你还在推送几天前,这个用户看足球的数据信息,这个生意就很难做下去了。 在腾讯,我们分三个领域各自研究精准推荐:数据整理、实时计算、算法研究。我深知,实时计算是关键核心。 在我的脑海中,一切数据必须以消息为中心,实时处理、提炼瓜分。实在解决不了的数据,再做离线分析。 比如一张照片,在数据处理端口肯定首先被实时过滤,这张照片是在哪里拍的?其中几个人,通过什么方式拍摄的?在所有数据收集处理完之后,我可能还需要找这张图片与其他图片的关联关系,这时才会做离线处理。 腾讯基本上90%以上的数据都是在线实时处理。我一直在坚持将腾讯的数据集中起来,放在一个平台体系之下,这其实是来自阿里巴巴的教训。(蒋杰原来在支付宝数据部门工作)阿里巴巴的数据直到今天还是四分五裂。 其实,我对于数据的实时经验也是在支付宝时期积累的。当时我学到的一点是,如果没有搜索引擎的支撑,就根本无法做数据分析。当时很多人都说,没有办法让数据在6秒内被搜索出来,而我坚持认为可以达到。 实际上,现在在腾讯,一万五千个字段,在3秒之内所有的数据交叉都可以实现。这是一个做技术的本分。 在实时这个领域,技术上的难点是什么? 我一直在慢慢弱化数据仓库,逐步走向实时数据仓库。其中最大的问题是,如何实现数据实时获取? 数据实时处理的前提,首先是实时采集。我的办法是一方面和业务部门谈好,另一方面我将数据采集文件部署到所有的机器里,从安装操作系统的时候就写入数据采集文件。这样,腾讯所有40万台机器都可以协同操作。 过去两年,腾讯从原来的一小时响应,到现在一秒钟精准推送,CTR (点击率)能提升20%。规模越大效果越明显。 精准推荐有三大要素,第一是数据,第二是实时,第三是算法。 首先要有强大的数据,如果数据缺失什么都干不了;第二,效果明显的是实时,第三才是优化算法。这是整个精准推荐体系的核心。实时在其中排在第二,我们的实践证明, 在什么都没变的情况下,频率改变带来了整体收入的提升。 在解决了获取数据之后,数据底层所遭遇的最大困难是什么? 眼下的挑战在于深度学习。大数据时代,腾讯有200PB的图片数据,如何去挖掘图片数据的价值?如何去挖掘语音数据的价值? 我们正在做的是从结构化数据分析转向非结构化数据。如何从非结构化数据中提炼商业价值?这包括了深度学习的DNN和CNN技术,包括如何做文本之间相似度的关系。这都是需要突破的点。 微信所有的语音训练都是深度学习的办法来处理。比如,每当你在用微信放语音的时候,机器自动翻译成文字,就是靠深度学习网络来训练的。但目前,计算能力依然是一个门槛,这个能力并非我们想象这么轻松,需要更多计算技术来改进。 未来数据处理会有剧烈的改变么? 硬件决定了数据的能效。数据规模越大,数据展现的方式会越多,未来实时计算的处理需求会越来越旺盛。相信未来,能贴合更多应用场景的高效计算引擎会出现,这是我对未来的判断。 很明显的是,如果当前一秒的数据没有处理完整,提炼清楚,随后的分析成本就会越来越高,而数据的价值则越来越低。所以,在未来,高效计算引擎和存储引擎的出现,会对大数据发展有突飞猛进的效用。 后记: 在蒋杰看来,没什么比实时更重要。在腾讯,他敏感意识到实时数据对于广告的价值,所以把大部分精力放到实时处理数据以及如何优化广告投放上。 今天很多公司的数据仓库是离线的,也因此数据距离实际业务很遥远,这个距离不仅仅是无法实时反应,更多在于无法保证数据的稳定和质量。 以此而言,数据实时化是业务与数据的结合的关键。 但实时数据并非终点。 每秒都在生产新数据,新数据与既有数据之间的关系如何梳理?假如我们一直通过数据收集、分析得知,电脑前坐着的是一只狗,但假如某天的数据收集显示,它会猫叫。那么我们能判断电脑前的其实是一只猫么? 这不仅仅是数据更新变化这么简单,而关系到我们如何判断和分析。 所以,此时,延时判断变得很重要。 如何在庞大数据面前,做出延时判断?尽管你有实时数据分析的能力。 这可能是下一个更有趣的话题。



via WordPress http://ift.tt/1EtO5Pa

Labels:

[repost ]Building a Production Machine Learning Infrastructure

original:http://ift.tt/1uxLOOs Midwest.io is was a conference in Kansas City on July 14-15 2014. At the conference, Josh Wills gave a talk on what it takes to build production machine learning infrastructure in a talk titled “From the lab to the factory: Building a Production Machine Learning Infrastructure“. Josh Wills is a the Senior Director of […]



via WordPress http://ift.tt/1oQoDcM

Labels: