声联网:用声音构造的互联网
发布者: Admin 发布时间:2016年06月29日 阅读次数:5368
声联网:用声音构造的互联网
鸟类是如何交流的? 通过鸣叫。现在,机器间的交流也可以用声音了。一批新型公司现在正制造一种被叫
做声联网的东西。
声音简史
我们来回顾一下。声音被当作信号的历史可谓久远。在最早的时候,号角、鼓和钟声鸣起警报的时候,鼓动
了集会、指挥军队和城市工人们;响彻整个城市的铃声指引着我们的生活。这些声音主要是为了交流,而音乐性则排
到了其次。
在一些似乎不大可能的地方中可以找到模拟声波代码:从莫扎特到舒曼的作曲家们在他们的音乐中隐藏有着
独特音频逻辑的音乐玩笑; 水下数据解调器引导着海军舰艇;电话网络会使拨号等音变得嘈杂。
对于许多人来说(包括我),第一次体验互联网是调制解调器发出像白头翁吱吱叫的声音,盒式磁带里的
PCM 编码游戏 - 这些声音不是数据本身而是数据传输的副产品,它们既不是为了在空气中传播也不是为了被人耳听
到,而是为线缆设计的。
随着小型音频片段能在移动设备上实时解码,我们来到了有着为进行无线传输而将 URL 编译成记录序列的
现代系统的数字时代。在这个无重量感知的数字世界里,很容易就忘记了信息也是一件物品,东西怎么会发不出声音
?在现在这个时代,机器也是能发出声音的,而且他们可以交流从图片到支付方式的任何东西。
声联网时代来临
这就是声联网。首先,机器可以通过声音将链接发送到远程网络,此外,机器内的查找表也不需要其它的网
络了:因为声音本身就是网络。如今的科技已经足够在可听域范围内或超出这个范围发送少量数据,也能足够好地将
每一个创建的链接编码成数秒或更短的音频。
这是个大胆的想法
声音有多种存在形式,首先也是最容易被忽视的就是网络形式。
想想看:这个地球上有着比人还多的微型廉价扬声器。为什么不利用这种无所不在的日常科技呢?我们看到
了一个简单而直接地连接大量设备的巨大机遇。
声音可以到达其它网络到不了的地方,而且声音可以和现有的协议一道成为网络生态系统有价值的一部分。
我们可以很轻松地
重新构造自动取款机、电视、玩具、收音机和平板 —— 只要能传播声音,就能发送数据。
它的原理是什么?
有许多技术可以搭建声联网,大致包括三个方面:
描述 :通过选中的已有的信号特征将两个信号区分开来,又称“音频指纹”。这样的例子包括音乐识别服
务,像 Shazam 和 Soundhound。极客们,请原谅我举这两个例子:虽然从广义上讲这些技术也可以被称为真正的声
联网科技,但即便是音乐也是能为点对点交流而进行重塑的。
添加 :可检索但人类难以觉察的特征(也叫“音频水印”)可以被添加到任意一个音频信号中。这样的例
子包括在无线广播中利用代码进行听众追踪。有一种方式是利用微小的,不易被人类察觉的快速回音,这些回音通常
被人耳听力忽略掉。这种方式被像 InFrasonics, mufin 和 Civolution 等公司使用。它的码率大致相当于上面的
指纹方式的码率。
编码 : 除了在大型线上已知声音库中节取一种声音,或者快速添加水印,完整的音频信号(音高,音色,
音阶或振幅)本身就是代码。Chirp 和 LISNR 的多音高系统就是如今被编码得足够强大以避免噪声干扰,失真和压
缩的例子。最近发布的 Google Tone 是基于另外一种多频编码方式的。纯代码信号的“清晰听觉”比起前两项技术
来有着更快的速度优势。
然而……
所有的方式都有相对的优势和劣势。通常在实用性和工程设计方面有冲突。信号可以包含丰富的数据,但是
不堪入耳。信号也可以让人毫无觉察地嵌入到弦乐四重奏中,但编译的数据微乎其微。信号在现实世界中的噪声、混
响等声音面前可能显得无比的脆弱。信号可以既不好听也不可靠。
通过声音传送数据必然是缓慢的。通过悦耳的声音传送数据那就更慢了 —— 因此,关键是要发送指针而非
文件。声波数据涉及到安全问题:一对多的数据分享相当有用,但不安全(看如何设计);那如果你只想分享给一个
人呢? 这是个有趣的挑战 —— 就在我们现在谈论时人们正在研究新的解决方案。声音有多种存在形式,首先也是
最容易被忽视的就是网络形式 —— 它是跨越最后那几米距离的桥梁,是去往其它网络无法抵达的地方的媒介。
务必小心
声音本身影响重大。谨慎郑重地使用声音,同时注意保护声波环境至关重要。从耳机漏音到街道噪声,再到
声波用户界面,我们已经有了太多随意而嚣张的噪音污染,而这些却在事后回想时被认为仅仅是按键提示音。
作为音频极客和音效设计师,我们在设计发送的声音时花费很多心思,而且我们明显地会在自然界,尤其是
鸟类语言中塑造我们的音频声音。声联网要有一种人性化的交流方式:也就是一种通过将人耳放在第一位也是最重要
的地位来尊重用户的方式。
声音无处不在
是时候兴奋了。老实说声联网的机遇大得令人难以置信,从现有的应用程序到便捷的资源配置。现在重新构
造语音,音乐和数据分享的声音设计这些都有潜力,我们公司在这方面比较活跃。
新的硬件会加快对它的理解:愈来愈便宜的手机专用 DSP(数据信号处理) 芯片,以及因始终在线的接收功
能以及无需用手操作的用户界面而需联网的设备,加大了声联网产品的覆盖范围和效率。我们已经看到音频被应用在
通过收音机发送比特币的支付方式中,在教室通过图片或网页分享以便将地图发送到手机上。我们才刚刚开始。总之
,从非智能手机到门铃,只要有声音的地方就有数据。