AI助力语音应用崛起,MEMS麦克风需求旺盛
source:paixin.com
人工智能崛起强化语音识别能力,促使语音成为重要人机界面,应用层面从手机拓展到智慧音箱、电视与车用等终端产品,进而带动市场对MEMS麦克风需求。但不同类型终端产品需要的麦克风阵列不尽相同,各厂商相继推出麦克风阵列解决方案,也成为厂商竞争的一大利器。
语音应用推升MEMS麦克风需求
2018年产值达15亿美元
语音控制一直被视为是最直观的操控方式,早在2011年Apple便推出手机语音助理Siri,但由于当时语音识别不成熟,导致语音助理成为手机娱乐产品。随着人工智能兴起,各厂商
透过自然语言处理(Natural Language Processing)训练计算机人类语言逻辑,提升语音识别能力,加上Amazon、Google、阿里巴巴与小米等厂商透过低价智慧音箱打入市场,让消费者快速了解语音的应用范畴,包含信息询问、家电控制与购物等,大幅扩增语音应用的可能性,促使语音成为新人机界面。
随着语音应用兴起,各厂商希望将新人机界面放到自家终端产品,因此推升麦克风需求,其中又以半导体制程MEMS麦克风需求成长最高。MEMS麦克风具备较高的可靠性、稳定性与一致性,声音采集质量佳,对语音识别有很大帮助,进而提升市场对MEMS麦克风需求。
因为各类型产品的外型、应用环境与使用方式不同,所以使用的麦克风数量和阵列模型也有差异,从麦克风使用数量来看,手机MEMS麦克风需求为2~4颗;智慧音箱需求范围较广,依照产品设计和价格定位,MEMS麦克风需求2~8颗不等。
由于智能音箱市场在2017年快速成长,推升整体MEMS麦克风产值达13.81亿美元;随着2018年MEMS麦克风进一步拓展到电视和穿戴装置,推升产值年增11%至15亿美元。
汽车是语音应用的另一大市场,透过语音控制能让驾驶人在不移转视线情况下直觉性操控,提升行车安全,因此车厂也开始导入语音控制系统,其MEMS麦克风数量2~6颗不等,甚至采用更多颗麦克风抑制噪音,有望带动另一波MEMS麦克风需求。
MEMS麦克风阵列型态与对应产品
MEMS麦克风阵列随着语音交互系统需求增加而开始受到重视,语音交互存在的环境相当复杂,若使用时相隔距离较远,收音上就会遇到回声干扰、室内混响与多信号源干扰等问题,导致讯噪比(Signal to Noise Ratio,SNR)降低,影响语音识别率。
过去智能型手机大多采用单麦克风系统,能在低噪音、无混响与近距离下,获取讯号质量较高的声音信号。但当环境中存在多个声源和环境噪音,例如客厅、厨房与户外等场域,就无法做到声源分离,进而无法对声源定位和识别。为了实现远距离语音识别,多麦克风系统应运而生,透过几何结构组合成线型、环型与球型等阵列,数量从2~1,000颗不等,目的是为了采集不同空间方向的声音讯号,进行噪声抑制、混响去除与人声干扰抑制后,方能做到声源侧向,再透过波束成形(Beamforming)做声音定位。
近年随着语音识别能力提高,加上厂商希望缩小产品设计并降低成本,因此开始减少MEMS麦克风使用量,一般消费性产品采用的MEMS麦克风阵列型态以线型和环型为主。但线性麦克风阵列仍旧有其限制,仅能做到180度声源定位,无法针对全方位做空间指向性,象是Amazon第三代Echo Dot就采用4颗麦克风,虽较前一代减少3颗,但仍是采用环型阵列。
线型MEMS麦克风阵列-宽边阵列
电视和NB等产品适合采用线性麦克风阵列中的宽边阵列,宽边阵列是指声波方向和麦克风阵列垂直,透过声波相加得出声源方位,且抑制来自阵列侧边的声音,使得前方和后方的响应一致,但该阵列具有轴对称性,无法分辨出前方和后方声源,因此适合声音仅来自前方或后方的产品,透过增加横向MEMS麦克风数量则能更有效抑制侧边声音,借此增加声源定位距离,不过MEMS麦克风间若间距过窄,会降低低频衰减,增加低频噪音干扰,但过宽又会造成机构设计困难,降低混叠频率,因此在产品设计上需特别衡量横向麦克风数量与其距离的安排。
以电视为例,其摆放空间大多在较空旷的客厅,且人往往距离电视较远,因此电视需搭载远场语音识别让用户控制,要强化远场语音识别的能力和距离,需要将数个MEMS麦克风排列成宽边阵列,除了可抑制电视两侧扬声器所制造的噪音外,也能增强声源定位距离,但远距离容易造成声音在室内不断反射,导致麦克风不断收到重覆讯号,造成识别困难。
线型MEMS麦克风阵列-端射阵列
针对单方向做声音侦测的产品,例如手机、耳机、助听器、智能手环与智能手表等产品,就适合采用线性麦克风阵列中的端射阵列。端射阵列是指声波方向与麦克风阵列平行,当前方比后方先接收到声波时,就能透过麦克风拾取声波的时间差得知声波来源,透过讯号处理抑制其他方向的声音干扰,形成空间指向性。
以穿戴装置为例,由于产品体积较小,难以透过多个麦克风做横向排列抑制周遭噪音,加上消费者使用穿戴装置做语音控制时,往往会靠近嘴巴,代表定向声源只有一个方向,而需抑制的噪音源同样是来自嘴巴,并非声源的反方向,因此透过端射阵列设计,能专注收取单一方向的声音。
环型MEMS麦克风阵列
环型MEMS麦克阵列是端射阵列的延伸应用,适用于需要针对全方位做声源定位和识别的产品,在设计上各MEMS麦克风需要等距且均匀分布在圆周上,且对角排列形成多个端射阵列,以利针对不同角度的声源做降噪、侧向与定位。
目前运用最广的语音识别产品智能音箱,即是使用环型MEMS麦克风阵列。
由于智能音箱在使用上不具备方向性,多摆设在客厅、厨房与卧房等区域,因此会因为环境多样性而使得噪声干扰方式不同,例如在客厅会受到多信号源干扰,在厨房则会受到诸多环境音干扰,在卧房则可能透过智能音箱播放音乐,导致噪音出现,加上用户声音可能来自四面八方,因此需透过环型阵列做波束成形的指向性收音和降噪,提高语音识别率。
MEMS麦克风阵列市场发展
随着语音应用兴起,MEMS麦克风阵列成为语音交互系统中第一道关卡,若MEMS麦克风阵列收音状况不佳,将严重影响语音识别率,因此MEMS麦克风阵列解决方案成为各厂商重点角逐市场。
当前全球最大MEMS麦克风厂商为Knowles,市占率超过3成,同时也掌握MEMS Die设计、MEMS麦克风封测与MEMS麦克风阵列模块,因此受到Amazon青睐。
▲MEMS麦克风供应链
source:拓墣产业研究
不过,并非所有厂商都有一条龙的生产模式,多数厂商涵盖设计到封测,或封测到系统整合厂部分,最后再由系统整合厂将MEMS麦克风模块或阵列出货给品牌厂商。象是STMicroelectronics只提供MEMS Die设计到MEMS麦克风封测,原因在于MEMS麦克风供应链呈现金字塔状,若STMicroelectronics跨足MEMS麦克风阵列模块,将会与原先的合作厂商竞争。
因此若厂商无法在MEMS麦克风阵列模块市场占到领先地位,则不必冒着失去客户风险切入市场;此外,语音厂商也开始进入MEMS麦克风阵列模块市场,将使该市场竞争更加激烈。
歌尔和瑞声不具备MEMS Die设计能力,仅提供封测到系统整合,为各类型产品提供不同解决方案,包含手机、穿戴装置与智慧音箱等,但随着语音厂商开始切入MEMS麦克风阵列模块市场,该市场竞争更加激烈,因此模块厂商开始向上游发展,象是瑞声开始研发数位ASIC芯片,不仅优化自身MEMS麦克风模块,同时也能增加产品毛利。
歌尔则透过封装方式将多个传感器整合,使得单一元件拥有多种功能,减少基板使用面积而具有成本优势。此外,部分声学厂商同时提供代工服务,例如歌尔、共达电声(002655)、奋达科技(002681)与美律等厂商皆提供智能音箱和耳机等产品代工,其优势在于声学相关产品的机构设计是声学厂商强项,且能直接提供声学模块给品牌厂商,因此受到品牌厂商青睐。
近期语音厂商开始朝麦克风阵列模块发展,原因在于语音厂商希望达到最佳语音识别率,若采取非官方认证的麦克风阵列,语音识别可能会出现误差,导致消费者体验不佳,因此为了让实际收音和训练样本一致,语音厂商开始推出麦克风阵列解决方案,象是Amazon、科大讯飞(002230)与阿里巴巴等厂商都提供相关解决方案;此外,语音厂商可以透过麦克风阵列模块进行语音资料搜集,以优化自家语音识别,同时也能扩大自家生态圈,从而拓展到更多产品,可谓一举数得。
语音厂商的跨入导致下游MEMS麦克风阵列模块市场开始出现变化,语音厂商透过软硬整合方式吸引厂商采用,采用厂商则能直接进入语音厂商的生态圈中,这对硬件开发商而言有相当强的吸引力。
面对语音厂商的挤压,原先的麦克风阵列模块厂商开始朝上游或代工发展,借此强化身产品竞争力,否则只能转向中低阶市场,最终面临被市场边缘化的风险。
文丨拓墣产业研究院 田志弘
本文首发于微信公众号:拓墣产业研究院。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。
本文系作者授权本站发表,未经许可,不得转载。
推荐文章
Recommend article热门文章
HOT NEWS