语音界面:下个世纪的触摸屏

人工智能和信号处理的DNA一起跟踪声音吗


引人注目的口号,”波士顿,信号处理,认为,“质量。的启动约公司创造了软件可以准确地跟踪一个声音的“DNA”无论听觉环境,开放激动人心的可能性的世界,人类已经开始与虚拟助手名叫Alexa, Siri,谷歌来简化他们的生活。

但约公司不仅仅是一个声音。虽然声音已经成为一个“杀手级应用”,约是其核心信号处理公司和人类声音听觉信号还有很多,这只是其中之一 它的强大的科技可以使人们更加孤立、识别、跟踪和好好利用。

视频长度是0:46。

约的技术使用AI和信号处理来消除背景噪声语音信号。

“一年半以前我们转向了基于战略选择的声音,亚马逊将使这一市场。我们一起成功了三行研究,利用声音的海啸。现在我们生活在一个世界里,与你的连接设备是一种常见的能力。”

肯•萨顿约总统,首席执行官和共同创始人

“下个世纪的触摸屏”

声音的想法我们与智能设备进行交互的主要方式不仅仅是方便免提命令或易用性;这是更直观。

这是更人性化。

“如果你问我为什么声音?或者更好的是,为什么我们跟我们的设备?”在返回我将问你一个问题:“什么是最自然的接口之间的两个众生?当然,答案是演讲,”萨顿说。

“我们一直与机器交互的方式直到现在人工,因为这些机器没能听到我们。自然的方式与一些交谈。这不是 一个进化。我们真的回到基础知识,这些基础将产生深远的影响。

“语音将成为下个世纪的触摸屏。”

一系列的声波突破

萨顿的大胆预测背后几声突破他和他约co-founders-Dr。美国哈米德英国人、首席科学家和詹姆斯·费尔雷高级顾问/音频领域的创新使信号处理、人工智能、方法论和广播工作室。

这些创新在过去的30年发生完全独立研究字段时,萨顿把好幽默有尽可能多的共同点西班牙语,意第绪语,和Vulcan-not只会增加深度约在“一夜之间”的成功故事,但也是一个窗口如何辉煌,决心,好运气,命运可以缠绕导致改变游戏规则的创新。

一个良好的开端理解Yobe技术故事是英国人博士的实验室。

博士在一个杰出的30年的职业生涯中,英国人用他先进的理解信号处理和人工intelligence-two高度专业化的领域和技能很少居民在同一的存在研究信号数组类型包括EMG信号,这些生物标记物在肌肉收缩测量电流。

笔记本电脑在MATLAB信号处理运行,显示三个时域语音信号。

约识别个人的声音在嘈杂的环境中,如人群,使用每个人独有的生物标识。

英国人博士开发了独特的人工智能信号处理算法来分解这些EMG信号,隔离他们所以关系个体肌肉反应可以更好的理解和测量。英国人能够有效地从嘈杂的环境中多个单独的个体EMG信号信号发射。

费尔雷在平行于英国人的开创性工作,终身大师的音乐混合业务和广播制作,正在接近他的心来解决一个问题:他的自闭症儿子的厌恶听音乐在封闭的环境中。

费尔雷都来操控声波来找到一种方式展示他们的儿子能顺利地感知。

“詹姆斯偶然发现了什么,”萨顿回忆道,“是一个音频文件,通过他的儿子的检阅。然而,由此产生的声音就像我听过;就像3 d或高清音频。出乎意料地,当我们压缩有效减少数据写点东西发生了违反直觉的,它听起来更好。”

费尔雷被赋予了一种技术修复的信号。操纵信号一般损害赔偿,这是许多原因之一,例如,MP3文件可以听起来这么细小或空心为什么声音人工语音处理解决方案。金宝搏官方网站

“当听一段视频信号处理积极,你通常听到负面影响声音质量的工件。不会自然听起来因为你破坏底层信号,你真的想保护。”

肯•萨顿约总统,首席执行官和共同创始人

工作自动化的手工工作室过程是故事与人工智能和信号处理世界相交哈米德博士的英国人。在努力创建IP Yobe广播工作室的技术和方法对声音信号增强和修复,萨顿发现他们能够修复信号“撕裂”的积极的信号处理问题,挑战了英国人博士和其他科学家在信号处理领域。

“我们的播音室signal-repair方法允许约使用很多积极AI-driven信号处理——Nawab-on博士前面的领域 最终,而宽恕我们在后端,因为我们可以产生信号,把它带回它真正的声音,”萨顿说。“这也让我们看到深入信号本身,确定其DNA,并链接到其个人来源和意义。在语音启动应用程序的情况下,我们可以把针从基本语音识别(电脑明白是说)说话人识别(电脑也明白是谁说)”。

英国人博士和肯·萨顿咨询软件开发人员约总部在波士顿。

英国人博士和肯·萨顿咨询软件开发人员约总部在波士顿。

约的专利组合的信号处理、人工智能和广播技术工作室是由一个主adductive推理模块,每个规程适用于正确的衡量,音频帧的音频帧。有了这些技术,约是加强在嘈杂的环境中启用语音应用程序的性能。这些都是真正的环境我们说:那些打开的窗口,环境声,刺耳的谈话在我们周围。

换句话说,这是“鸡尾酒会问题”,信号处理世界的框架的一个基本方式,长期挑战:孤立单一的声音在“真实世界”的声波画布的哗啦声。

“这么多工作在语音识别领域,一直在做控制,无菌环境,这就不是我们人类居住,工作,玩,和谈话,”萨顿说。“我们采取了不同的方法,得到了回报。”

萨顿说,一样快乐不讨论约的成就的鸡尾酒会问题。他尊重他人的努力太多太多的信贷,而是说,“我们已经想出了一个独特的管理方式和处理它。”

这样现在导致新一代的应用程序和功能与机器使我们的谈话更安全,更安全,更高效。这也是确保在下个世纪的触摸屏将在现实世界中运作良好,不仅在一个隔音的房间。

约一分之三的方法

约的突破性应用结合三个不同的研究领域:

  • 信号处理:识别、分离和跟踪个人声音的“DNA”
  • 人工智能:教学应用程序识别个体的DNA的声音
  • 广播工作室技术:恢复信号被AI勘探到原来的状态

MATLAB的因素

构建应用程序,结合信号处理、人工智能、和工作室广播技术 需要 一个特殊的开发环境,并在MATLAB Yobe找到了一个®从MathWorks。

“MathWorks一直是一个伟大的合作伙伴在我们的过程中,在几个不同的方面帮助我们,”萨顿说。“MATLAB信号处理空间中无处不在:它占主导地位的大学课程和信号处理阿富汗人喜欢爱设计。不仅使我们更容易开发我们的解决方案,但是也促进了知识共享与同事。金宝搏官方网站我们可以描述我们所做的和人得到它。MATLAB提供了一个‘得到’的因素。”

“MATLAB软件开发是理想的多学科,许多股融合成一个,”英国人博士说。“设计的MATLAB垂直允许我们开发我们的解决方案,在筒仓,然后一起把这些筒仓。从软件开发框架的角度来看,我们的解决方案是建立一个像乐高积木。MATLAB使得我们很容易将这些块如何在我们需要的地方,我们希望我们的解决方案基于功能。”

“作为公司的首席执行官,我的一些责任是融资和业务发展,”萨顿说。“MATLAB演示提供了一个极好的环境对于我们的羽翼未丰的概念早在商业级。MATLAB使我们演示了科学在其development-helping的每个阶段,我们分享我们的进步和为我们创建构建兴奋。这是我们行动的关键风险。”

医生调整这种新型Mama-Ope夹克上的孩子。

阅读其他故事

面板的导航

生物技术

而儿童肺炎

将医疗危机转变成工程挑战拯救生命

面板的导航

人工智能

Cyborg鼓手和AI的团队创造音乐,不是人为:

设计一个机器人假肢的专业鼓手

面板的导航

人工智能

进入杂草:

农民依赖人工智能提高产量