您当前的位置:科技评论网资讯正文

SoundHound 再也不是一个音乐识别软件了,他要做Siri没做到的事情

放大字体  缩小字体 2017-09-10 02:26:48  阅读量:9311 来源:36氪 作者:吴倩莲

音乐雷达类产品,都“意不在音乐”。Shazam 从音乐识别扩展到图像识别,瞄准多屏互动和O2O,切入到整个企业营销市场。

而另一个产品 SoundHound,看起来没有 Shazam 这么多动静,直到今天——今天他们上线了新产品 Hound 的安卓内测版。

说出来吓死你,Hound 已经秘密研发了 9 年。创始人和 CEO Keyvan Mohajer 形容他们过去低调的经历为“硅谷隐藏得最深的秘密”。音乐识别从来只是他们的第一步,他们一直以来都在埋头研究技术:语音识别和自然语言处理。现在时候到了,他们推出了 Hound,要让它来解决人类对语音助手更大的需求。

换句话说,Hound 就是在做一个 Siri 这样的语音助手。市面上有这么多款语音助手了,Hound 的区别在哪里?其实没有什么差异,Hound 要做到的区别只有一个字:更好。

官方称目前 Hound 比较强的地方包括导航,本地搜索,天气、股票、时区、地理等信息,酒店信息、航班信息,新闻,图片和视频搜索,货币换算等。

在 Mohajer 向外媒展示 Hound 的时候,我们能看到 Hound 在一些方面表现很强大:

能理解复杂的长句。Mohajer 向 TC 展示的时候说了一个很复杂的长句:When is the sun going to rise two days before Christmas of 2021 in Tokyo, Japan?

可以理解对不同主体的连续疑问,比如问“日本有多少人口啊”,然后再问一句“中国呢?”。也能对一个主体的不同事情联系发问,比如问完“中国有多少人口啊”之后,直接再问“所以按每平方公里来算是多少”。

另一个特点是延迟低。在发文之后,Hound 不会隔太久就能给出回答。Mohajer 解释道,这是因为 SoundHound 把语音识别和自然语言处理结合在一个引擎里,而不是把它们当成两个分别的任务区处理。

此外,Hound 在一些服务上接入了第三方应用的服务。比方在处理酒店预订时,Hound 和 Expedia 合作,用户实际上是在后者的库里搜寻信息以及预订服务。但是与第三方合作的时候,貌似延迟会严重一些,大概 3-4 秒左右。

除了直接面向用户的 Hound App,这款产品还上线了一个开放平台。开发者可以轻松地为自己的 App 里添加一个语音交互。Mohajer 提到,Hound 地最终目标,不只是和 Siri 这样的语音助手或者 Google 这样的搜索引擎去竞争,而是希望将整个移动互联网的交互趋势从“触摸和点击”转移到“语音”。

但是一个创业公司来做这件事情的确困难。技术只是一方面,长久以来用户已经形成的使用习惯是另一个门槛。如果说服用户下载 Hound 并探索 Hound 的种种功能,这并不容易。

这也是他们要做开放平台的原因,让各种各样不同的 App 去帮 Hound 推起语音交互这个潮流,比他们自己推面向用户的 App 容易一些。

题图来自 Re/code

[参考来源:TC、Re/code ]

原创文章,作者:thethief

责任编辑:王晓易_NE0011

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!