深度 | 邓力：从语音 AI 到金融 AI，挑战有哪些？

雷锋网 AI 科技谈论按：7 月 12 日-7 月 14 日，2019 第四届全球人工智能与机械人峰会（CCF-GAIR 2019）于深圳正式召开。峰会由中国较量机学会（CCF）主办，雷锋网、香港中文大学（深圳）承办，深圳市人工智能与机械人研究院协办，获得了深圳市当局的鼎力指导，是国内子工智能和机械人学术界、工业界及投资界三大范畴的顶级交流博览盛会，旨在打造国内子工智能范畴极具实力的跨界交流合作..。

7 月 12 日，加拿大工程院院士、Citadel 首席人工智能官、前微软 AI 首席科学家、IEEE Fellow 邓力传授为「人工智能前沿专场」带来了《AI Models：From Speech and Language to Financial Markets》的大会申报。以下为邓力传授所做的大会申报全文。

本次我演讲的主题或者跟其他演讲者不太一般，但我相信个中照样有一些共性值得我们商量。因为人工智能涵盖了好多范畴，个中就包罗适才 Hackman 传授提到的主要主题，即人工智能和教育以及人工智能若何在教育范畴实现更多的应用，我认为这一类的落地应用绝对是人工智能范畴将来成长的重点之一。

今天我要重点分享的内容包罗两个部门：第一部门是人工智能语音说话范畴的应用，好比说语音识别和说话处理；第二部门是过渡到人工智能在金融范畴的一些前沿进展和挑战。1、语音汗青

首先，我先介绍一下今朝深度进修（即现代人工智能手艺）在一些范畴中现有的成功应用。

近年来，深度进修的成长稀奇快，例如语音识别，天然说话处理、机械人、较量机视觉等范畴取得了非常大的进展。同时我也认为，这些范畴在接下来的几年时间内还将实现更大的成长。

此外，我认为一些人人对照存眷然则还没有经由媒体上看到的取得稀奇猛进展的行业，如农业、教育、金融以及零售等，也具有非常大的潜能。在这里，我会重点介绍人工智能在金融范畴的可行性。

在此之前，我先问人人一个问题，人人感觉人工智能在鞭策金融市场（包罗贸易模式和生意）的转型上有多大的潜力？为了让人人更好地回覆这个问题，我们先往返顾一下也许十年前发生的一件事。

2009 年 12 月 12 日的 NIPS 上，我负责主办了一个 workshop，其时我邀请了微软和多伦多大学的同事们列入，与俞栋、Geoffrey Hinton 一同商量了深度进修将来的成长前景，并经由查询研究从分歧的维度来剖析深度进修和神经收集在语音说话范畴将来几年的成长态势。

之后，我们微软在语音识别和翻译范畴投入了好多人力，进展经由深度进修、神经收集来实现机械语音识别和翻译。经由微软两年高强度的研究，2012 年，深度进修在语音识别范畴取得了较大的进展，这也是深度神经收集研究在语音识别范畴上的一次早期的大规模测验，也是深度进修第一次在工业界取得成功的案例。

2012 年，正好就在中国天津，我其时地点的微软研究院测验使用语音识别和翻译手艺来对演讲进行英到中的白话主动翻译。这能够说是语音识别范畴的一个里程碑式的时刻。在这前后，科大讯飞、百度等好多公司都到场到这个范畴的研究中来，研发基于深度进修的新一代语音识别和翻译手艺。

而更早之前，大约从 1993 年起头，我和好多同业者就起头研究即时语音识别手艺。到 2000 年，即时语音识其余错误率非常显着得在络续下降，但其时基于隐马尔科夫模型的语音识别手艺在 2000 年至 2009 年时代一向处于瓶颈阻滞期，而在 2009 年引入深度进修今后起头有了新的进展：2009 年至 2012 年又有了第二轮更显着的错误率的下降。1993 年到 2000 年、2009 年至 2012 年是这项手艺的两个标记性的阶段。

十年今后的今天，人人或者认为这一切都成长得天然而然，对人工智能范畴的所有概念都习认为常，但在谁人时候，深度进修的应用是非常罕有的。2、从语音到金融

上图是用于语音识其余常见深度神经收集架构，获得了很大的成功，我们同样也进展让这项深度进修手艺在金融范畴施展同样的感化。

上图是常见的语音识别系统的根基构成模块。我们将麦克风拾取的声音和文本作为数据，经由声学模型、词义模型和说话模型等分歧的模块来练习完整的语音识别系统。我展示这个图首要就是想给人人看我们最早期的研究体式是怎么样分步练习完整的语音识别系统的，就是说在真正的深度神经收集起头之前，我们会使用分歧的语音和文本数据来练习这些分歧的模型模块。

这些分歧的模型模块的研发过程中往往是相对自力的，尽量是微软如许的公司，在早期都是自力组建团队去专门负责声学模型和说话模型分歧模块的研发。然则成长到后期，因为有了深度神经收集端到端进修的能力，我们就能够竖立综合性的解决方案，将所有分歧的声学模型模块和说话模型模块保持起来综合练习。

金融界的从业者应该都知道，今朝量化生意的系统也分成很多分歧的模块，雷同于深度神经收集端到端进修之前的语音识别系统。现代语音识别从自力研究分歧模块的体式改变成一体化模型研发，使得模型的综合性越来越高，这应该有助于开导研究者们思虑如何改善基于相对自力模块的量化生意的金融系统。

在天然说话处理方面，深度进修同样起到了推翻性的感化。个中就包罗机械翻译，关于这个部门，周明博士会在今世界午的演讲中跟人人具体分享。

而深度进修等热点手艺的挑战在哪里呢？首要还在于需要设计一个准确的、合适的架构来落地，包罗清楚响应应用范畴的机械进修难点，同时也需要充沛的有标注的数据来练习机械解决问题。前一轮的人工智能手艺无法成功解决大型的问题，需要经由如今新一轮的人工智能手艺来解决。

简洁介绍一下深度进修在天然说话处理的一个有趣的应用 --- 看图说话。上面这张图像是奥巴马的夫人和她的女儿们以及..的合照，人工智能手艺能够经由脸部识别与数据库进行比对来识别他们的身份，然后用一个天然说话的句子来描述这张照片的内容。这是人工智能手艺应用得非常成功的案例之一。3、三大奇特挑战

作为一个非常特别的范畴，金融范畴在人工智能手艺应用层面所面临的挑战要比我在前面介绍的语音说话范畴更大，个中以三大挑战最为典型，包罗：

其一是金融数据的噪音非常大，不光在输入端，更在输出端。在金融市场中，好比说股市存在的大量市场数据就有非常大的噪声，这些数据好多时候不克反映真实的股票市场情形，甚至噪声还会笼盖掉有效的信息。是以需要人类剖析师某人工智能去对这些数据进行提炼，从而获得有价格的信息。也就是说，若是你要基于一些金融机构供应的数据做展望，首先就需要清扫噪音，而对于语音识别、天然说话处理等范畴而言，这一类挑战几乎是不存在的。今朝，金融范畴还没有响应的成熟机制来解决这一问题，所以需要索求各类人工智能手艺来解决这一难题，而我们今朝也看到了一些进步的偏向。

其二是因为数据共享缺失以及数据和市场的非不乱性所导致的人工智能建模问题。这个挑战很大水平上是因为金融范畴的竞争特征所决意的。金融公司的算法和数据根基上都无法像好多巨头科技公司那样将好多算法和数据进行开源分享，所以竞争激烈的金融范畴是无法像天然说话处理等范畴那样，可以基于曩昔的大数据用统计学的方式进行大数据剖析，只能对一些在络续更改的波动数据进行剖析。同时，激烈的竞争还会让新斥地的统计模型和算法逐渐失去他们的有效性，远快过天然说话处理和语音识其余模型和算法。是以，这个在金融范畴独有的棘手和难以驾御的问题同样也需要非常特别的人工智能手艺来解决。

其三是异构数据问题，包罗非传统金融数据和传统金融数据的整合和综合行使。以华尔街的金融剖析师为例，他们并不都在使用尺度数据。传统的金融数据包罗好多种，个中一种是市场信息，好多手艺剖析师都使用一套划定和模板识别来剖析股票；另一种叫做根基面数据，即剖析师凭据公司曩昔、如今和未来的盈利剖析来展望将来的股市转变。他们会基于金融市场的曩昔数据和公司的根基面数据来看其呈现的动态，从而进行宏观和微观经济学剖析。非传统金融数据，也称为另类数据，包罗对金融市场有影响的海量文本、卫星图像和语音数据等等。这种数据的多样性就是这里讲的异构数据的问题。它对于传统的统计方式和金融数据剖析而言，是一个伟大的挑战。而有了人工智能赋能后，金融投资范畴就可以对异构或非尺度金融数据进行更精准的剖析。这是因为深度神经收集能够很天然地将异构数据整合在一路。4、若何应用 AI ？

如今，华尔街的好多金融机构都存眷或应用了人工智能手艺，个中一些我熟悉的对冲基金也聘用了同我有雷同配景的人工智能专家来匡助他们斥地响应的人工智能手艺。在两年多前，我们（Citadel）就启动了相关的研究项目，而我们的竞争敌手如 Two Sigma、DE Shaw、JP Morgan、Goldman Sachs 等也在一年前聘用了人工智能科学家，跟进了相关的工作。它们如今也在人工智强人才上同我的团队竟争。金融机构争相勘实本身的人工智能手艺的这一近况，也间接解说了人工智能手艺的应用对于金融投资范畴的感化不问可知。在使用人工智能剖析金融市场时，能用到一些对照显着的异构数据。这里我举两个例子，都是起原自金融学的学术文献。

一个例子是新闻社交媒体的文本数据。好比说，我们能够采用人工智能来剖析一些新闻社交媒体对于市场行情的剖析和商议，以认识机构投资者以及散户投资者对于金融市场的情绪。这一点是非常主要的，因为金融市场实际上包含心理学上的博弈，也就是说这是生意双方在市场上的博弈，由此形成金融市场的走向。是以，天然说话处理等手艺对于金融剖析而言，是非常有意义的。

另一个例子是公开演讲或访谈的数据。这种数据对于金融投资剖析来说，也是一种有效的异构数据。举个例子，在 Enron 出事的前段时间，我们是否能从这家公司 CEO 的某个采访中看到一些欺诈或遮掩的猫腻？他们在访谈中或者会透露一些微弱的旌旗，也或者会有意说谎话，而且在说谎话时的说话体式或者会跟说实话的时候不太一般，其时呈现的语音语调、互动脸色都可以成为寻找蛛丝马迹的点，也都能够成为剖析金融市场的波动和走向的信息源。投行等机构，也都邑在与一些公司的 CEO 打交道和交通的过程中对其进行剖析，以获得一些有价格的信息。而这个寻找一些蛛丝马迹来剖析问题的过程，实际上是能够经由人工智能赋能金融市场来完成的。

那么为什么如许的一些另类（异构）的数据对于金融市场的研究至关主要，且是举世无双的呢？因为其实人工智能的好多落地经常只会用到单类或至多两类数据：影像数据和文本数据。而对剖析金融市场有效的数据则加倍复杂、加倍多类。一样剖析师经由根基面数据来剖析上市公司在金融市场、实体经济中的市场示意等，这些数据能够充裕显现某家公司今朝的财务状况、经营状况，同时，它能够同汗青市场数据以及图像，文本，甚至和语音数据综合起来应用。而这个将所稀有据整合起来的过程，是可以经由人工智能来助力和赋能，整合涣散的多类数据，从而挖掘更多实情。

那投行和对冲基金等在使用人工智能手艺剖析金融市场时还能注重其他哪些事情，将来能做什么呢？

首先，我们要确保数据的可获得性，也就是说让更多的人更好地获得一些对他们的研究有匡助的有价格的数据，如许我们才有更大施展空间。

其次，我们要确保数据不入侵隐私，掌握好金融风险。对冲基金公司固然拥有非常多的数据，然则需要加倍精准地去筛选合适的数据并不入侵隐私。

同时，我们需要招募到一些具备精巧金融素养的又精晓人工智能的有价格的人才，同时也需要对有潜力的人才进行..。一样而言，拥有很强金融配景的人或者不太精晓人工智能，所有我们稀奇需要招募到既有金融配景又懂人工智能的人才，他们就是我们所说的「明星雇员」。

最后，我们也需要针对金融范畴的数据剖析定制算法，从而更好地应对金融范畴所面临的奇特的挑战。

感谢人人聆听我的演讲。

演讲竣事后，雷锋网(公家号：雷锋网) AI 科技谈论也对邓力传授进行了提问，在提问中问到了人人都对照存眷的两个问题：一是邓力传授与Geoffrey Hinton 传授的渊源；二是邓力传授从微软去职进入金融范畴后的一些感触。雷锋网 AI 科技谈论整顿如下：

AI 科技谈论：您放下神经收集的研究再到重拾该偏向的研究并取得冲破性的进展，似乎都与 Geoffrey Hinton 存在着某些关联，您如何评价 Hinton 对您研究生涯的影响？

邓力传授：是的，Hinton 对我的职业生涯匡助很大，首要施展在两个方面：

第一个是我在他身上看到了信念的力量。Hinton 从神经收集的研究初期，也就是人人非常质疑这种方式的时候，他始终都对峙神经收集可以解决人工智能问题，一向到如今，我小我真的非常信服他。

第二个是脑筋方式。在跟 Hinton 的合作中，他教给了我好多好的脑筋方式。

AI 科技谈论：在此前媒体对您去职微软的报道中，认识到您曾透露「我感觉如今金融范畴已经非常成熟了，能够让人工智能来大显神威。」您进入金融范畴两年多，设法是否还与昔时一般呢？

邓力传授：进入金融范畴之前和之后的感触是完全分歧的。

在进入之前，我其时的设法是，我本身在语音识别及信息和说话处理等范畴已经研究得对照不错的，对于我而言不再具有稀奇大的挑战性，所以我就想换到一个更具挑战性的范畴去睁开研究。其时考虑到金融范畴的数据量稀奇雄厚，更多的数据就可以让我的研究工作做得更好，而需要用到的最根基方式与我之前用的那一套不会相差太远。其时就感觉到金融范畴做研究问题应该不大，而且非常具有前景性。

然则真正转到金融范畴后，我才发现，该范畴在应用人工智能方面的挑战性远远要比另外我熟悉的范畴大得多，就好比我在演讲中提到的数据的噪声大、由竞争导致的非不乱性以及异构数据问题，这都是非常复杂有趣的。不外我们今朝也取得了不少手艺功效，可以对照好地解决金融范畴的特别问题。

雷锋网 AI 科技谈论报道