• 君林科技“官宣”: 声音或将成为最自然的ID

    2018年11月28日来源: 东方网

    “一个民族的繁荣取决于创新活动的广度和深度,国家层面的繁荣源自民众对创新过程的普遍参与。”当前,我国正处于产业创新的战略时期。

    随着物联网时代的加速来临,大数据、云计算、人工智能等新技术以及新零售、消费升级等新理念成为市场热点。语音作为最自然的人机交互入口,声纹识别则自然而然成为最方便的身份认证方式。可以想象在不远的未来,声音必然会成为我们最自然的身份ID。

    君林科技CEO王群(图)

    “互联网带给人们的变化是翻天覆地的,而君林科技是将积累多年的声学技术,自主研发多项专利固件算法;依托于大数据/云服务及人工智能深度学习技术,形成全场景的声纹识别解决方案,并推动声纹识别技术在全球范围的产业落地,帮助产业智慧升级,从而改善人们的工作与生活,这对于市场来说,也是颠覆性的。”君林科技CEO王群说道。

    据介绍,北京君林科技股份有限公司,是国内声纹识别龙头企业,公司专攻固定短语和自由文的声纹识别,提供从前端声学采集降噪,到后端模型算法、声纹数据库的一套完整解决方案。利用自身的AI能力赋能产业升级,打造行业智能+。目前,已获得14项自有发明专利,1项国际专利授权,并获得来自海泉基金的千万级天使轮融资。

    领跑业内声纹识别的技术优势

    业内领先算法:君林科技采用先进的、基于深度学习的声纹识别技术和声学建模算法,已实现真实场景中固定短语识别准确率98%,自由文准确率97%。

    高鲁棒性:经过海量数据训练,针对信道、语音内容、时变、表达方式以及跨年龄等问题进行了良好的鲁棒性处理,适用于更多复杂场景和环境下的远程操作。

    安全系数高:数据加密保护,数据和服务、模型分离部署,单独存储,抵御系统入侵,确保数据安全。

    另外,本地化或云端API的解决方案方便跨平台集成、基于云平台及容器技术便于扩展等也是君林科技的技术优势。

    现在,君林科技秉承着让声纹技术普惠落地的理念,不断做技术深耕。伴随着越来越多产品与解决方案的落地,君林科技凭借过硬的技术实力和产品及服务赢得了越来越多合作伙伴的口碑与信赖。这就意味着,君林科技的未来是一片星辰大海,让我们共同期待。

  • 用短语代替数字声纹识别,「君林科技」获千万级别天使轮融资

    2018年9月29日来源: 36氪

    自由文识别是声纹识别的未来

    36氪获悉,声纹识别技术服务商君林科技近期完成一轮千万级别天使轮融资,投资方为海泉基金。君林科技创始人王群表示,本次投资将用于研发投入、硬件生产及人才引进等。

    君林科技成立于2016年,是一家专攻固定短语和自由文的声纹识别技术服务商,提供包含智能电视、智能音箱、车联网等智能家居和工业落地场景的技术服务。

    不同于语音识别解决“说了什么”的问题,声纹识别回答“说话人是谁” 的问题。随着语音交互的发展,声纹识别作为一种安全验证方式,天然成为物联网身份识别的入口,也是个性化服务的前提条件。

    声纹识别按照技术从易到难排序如下:固定数字、随机数字、固定短语、自由文、分割和聚类。但从使用体验来讲,却是反序排列。今天的数字识别技术已经基本成熟,得到商业化应用。其它声纹识别技术尚不成熟,少有好的应用案例。

    固定短语的语音识别技术在实验室环境下准确率已经能达到99%,但在现实应用场景中准确率大幅降低,甚至低至80%。

    主要有三个原因:

    1、时间的鲁棒性。现实应用都是跨时间的应用,实验数据往往是集中录制。

    2、环境噪声及混响。声纹相比语音识别更容易受到环境噪声和混响的影响,真实场景中不可避免的存在各种噪声和混响。

    3、说话人的发音随意性。现实生活中人们发音具有一定的随意性,或大或小,或轻或重,不如实验室录制的一致性强。

    真实场景准确率低造成声纹识别落地的困难。可以说,真实场景的准确率如果不能达到95%以上,则会在很大程度上影响体验感,难以落地到场景中。

    君林科技专攻固定短语和自由文的声纹识别,提供从前端声学采集降噪,到后端模型算法、声纹数据库的一套完整解决方案。

    经过2年多时间打磨,君林今年年初完成了新一代的声纹识别模型。据创始人介绍,君林已实现真实场景中固定短语识别准确率98%,自由文准确率97%。这一准确率已经超越了对应公司Nuance96%(内部测试数据)和百度92%的识别准确率(公开论文数据,2017)。

    商业场景落地是技术类项目的核心难点。据创始人介绍,君林在智能家居和工业场景都已经有相应产品落地,进展顺利,但目前暂不方便公开披露。

    团队部分,创始人王群曾任中国电声骨干企业技术负责人。核心技术团队包括师承COPSS总统奖获得者Prof. Nancy Reid的多伦多大学统计学博士Becky.Lin及计算机博士Chuan.Ma,以及研究大数据和AI深度学习超过10年的多位技术专家。

    声纹识别赛道是一个正在爆发的蓝海市场,涌现出了不少的优秀玩家。百度在这一领域上持续发力,2017开始与农业银行共建AI智能银行。IDG投资的SpeakIn也在安防领域不断拓展新的落地场景。数字声纹识别方向上,清华教授郑方带领的得意音通也赢得了建设银行、国家信息中心、中国银联等大客户。智能音箱赛道中,天猫、ROKID等也开始加入声纹识别模块。2018年,声纹识别正在一步步进入大众认知视野。

    关于本轮投资逻辑,海泉基金方面表示,随着物联网时代的加速来临,声纹识别已成为人工智能领域重要的入口。君林科技在技术人才、产品评测方面都具有自身的优势,看好项目的未来发展。

    海泉基金是一家关注智能科技、消费升级、文创领域的早期基金,由音乐创作人胡海泉创办。自2014年成立以来,投资了包括铜师傅、悦米科技、临奇科技、新片场、风霆迅在内等诸多项目。

  • 声纹鉴定技术与犯罪嫌疑人的斗智斗勇

    2018年3月5日来源: 君林科技

    前阵子,悬疑爱情剧里有一段关于声纹解锁的剧情很有意思。女主怎么也打不开车门,而男主在离自己车子较远的地方,说了一句“安迪,开门”,车子就打开了。这炫酷的场面其实是“声纹解锁”在发挥作用。声纹指的是能够识别某人或某物的声音特征,有唯一性,方式是通过电声学仪器显示出带有言语信息的声波频谱来实现的。

    在声纹识别和鉴定的领域,有两种重要的技术,就是声音识别技术和“声纹鉴定”技术。“声纹解锁”属于第一种,声音识别技术。高科技的新车拥有“声纹解锁”功能,它识别出来了男主的声音,所以开了锁。而女主的声音不在声音识别的范围里,它就不能打开车门。

    声音识别技术面临“窃密”罪犯挑战

    当然,现阶段,声音识别技术的存在主要不是为了好玩儿,它除了让人们的生活更加方便,更重要的是可用于安全防范领域,抵挡“窃密”罪犯的攻击。举个例子,很多公司都有机密性的文件,而并不是每个公司员工都具备机密文件的访问权限。于是,为有限定的访问者设定“声纹解锁”是一种不错的方法,通过对访问者不同的声音进行甄别,达到了身份识别和验证的效果。那么如果不在“声音识别”范围内的人,就不能够解锁,也无法访问机密文件或者登陆涉密系统。

    某些意图“窃密”的罪犯会尽可能地去破坏声音识别技术,比如通过录音、合成的技术去模仿能被系统识别的声音。虽然“窃密”罪犯的手段高明,但现阶段却不会让他们轻易得逞,因为合成的声音与自然的人声还是有一定的区别。随着科技的进步,声音识别技术也在不断进步,声音识别系统鉴别合成声与人声的能力也在不断增强。合成的声音是很难骗过先进的声音识别系统。

    变声器vs“声纹鉴定”技术

    而如果说声音识别技术是对付商业罪犯的,那么“声纹鉴定”技术大部分情况下针对的则是刑事罪犯。刑事案中(尤其以绑架案为主),罪犯为掩饰自己的身份,经常会使用变声器。变声器是可以改变输入音频的音色、音调,并将变声后的音频输出的工具。

    在我们的印象里,变声器可以完全改变一个人的声音。在影视剧当中,我们也经常可以见到变声器带来的神奇效果。一个浑厚的男声经过变声器的“魔法”,听起来完全可以是一个尖利的女声。变声器甚至可以把人声变成像卡通人物那样的声音。

    那么当犯罪嫌疑人的声音用变声器处理过,抓捕和定罪的时候就会遇到很多困难,这时候声纹鉴定技术就派上了用场。声纹鉴定技术分辨人声的能力毋庸置疑,但它是否足够先进到能够鉴定出变过声的人声呢?答案是肯定的。

    我们先要弄清“声纹鉴定”的原理。我们的声纹采集到机器上,会变换成一个图谱,因为声纹不同,每个人所形成的图谱就不同。这种图谱包含了一些数值,“声纹鉴定”就是通过分析这些数值,来辨别不同的声音。一般情况下,“声纹鉴定”分析的是绝对值(magnitude)的分布,因为这往往是不同声音之间最大的不同。这也就给了变声器空间,因为大部分变声器改变声音改变的也就是绝对值这一块儿。

    不过随着技术的进步,“声纹鉴定”技术分析的数值更为广泛和全面,包括分析相对值(phase)等。虽然罪犯使用变声器改变了声音,但他无法改变声音的全部内容,仍然有许多他本身的声音细节残留。而使用更先进的“声纹鉴定”技术,就完全可以把这部分没有被改变的声音识别出来。

    所以,即便变声器听起来像神奇的魔法,有了先进的声纹识别和鉴定技术,罪犯仍然无所遁形。

    北京君林科技股份有限公司

    北京君林科技股份有限公司,是在电声行业技术领先的高科技公司,君林科技在声学、无线音频、AI声学、声纹技术、云端、语音大数据以及人工智能领域均处于行业领先位置,提供先进的解决方案和专业的服务,推动人工智能技术产品落地, 打造人工智能时代的金耳朵。

    公司凭借声纹识别核心技术与银行、社保、公安以及智能硬件行业展开合作,提供如移动支付、远程办理、声纹安全识别、用户注册等解决方案,并迅速积累大量语音数据库,将在行业内形成强有力的竞争力。

  • 社保领域引入了声纹认证技术:为公共服务工作的正常开展保驾护航

    2018年2月28日来源: 君林科技

    在电声学仪器上,人的声音因携带的言语信息而呈现出各不相同的声波频谱,即通常意义上所说的“声纹”。不同的音高、音强、音长、音色,带来不同的波长、频率、强度和节奏。成年人的声纹具有鲜明的独特性和稳定性,与指纹、掌纹、手指静脉等一样,可看做是代表人类个体唯一性的生物信息特征。纵然旁人故意模仿说话声音,也无法还原出一模一样的声纹。因此,日趋完善成熟的声纹识别技术,在保护个人敏感信息、确定身份认证、加强安全防护、协助调查取证等方面,都发挥了积极有利的作用。

    在社保领域引入了声纹认证技术,能为相关公共服务工作的正常开展保驾护航。社保认证用户数量庞大,精确度高,任务繁重,在具体开展过程中,经常会出现各种问题。

    众所周知:中国目前已进入老龄化社会,全国60岁以上的老年人数量约1.78亿。由于我国幅员辽阔,各地发展水平层次不齐,在养老保险逐渐普及的今天,养老金发放和管理工作由于审核和制约手段不严,遭遇了前所未有的挑战。如出现他人冒领,或隐瞒当事人已去世事实而继续认领等现象,令国家养老保险行业信用受挫,造成重大经济损失。

    同时,中国流动人口众多,不少人的社保缴纳都不在户籍所在地,异地办手续不但麻烦,也给身份审核带来困难。旧时传统的人工审核身份方式,不论调查、走访还是采集,在社会高速发展的今天已经愈发不合时宜,而之前引入的人脸识别技术容易出现图片合成伪造,化妆整容的现象,指纹识别则有采集困难,以硅胶指模造假的情况。结合以上情况:核对身份既要满足准确率高,又要实现方便快捷,这正是声纹识别系统验证平台受到重视的原因。显著优势主要有以下几点:

    一、方便准确

    不论是面对面还是异地,都不会对声纹提取的准确性造成影响。录制声纹时,手持一只麦克风即可操作,而通过互联网进行远程身份识别时,只需要手机操作就行。比指纹、虹膜、掌纹等识别技术都要成本低廉,使用简单。

    二、流程透明

    由社保中心聘请专业可靠的专业人士,给办理社保的当事人采集声音,并用仪器分析出声纹的基因序列,形成权威有效的声纹数据库。这样只需说话,通过系统语音验证,便可判断出是否为办理者本人。结合人脸识别、指纹识别等辅助检测方式,不但大幅降低被他人冒充的可能性,而且提升了工作人员的办事效率,是社会公共服务系统迈向高效、智能、人性的里程碑事件。

    三、安全隐蔽

    保护公民隐私,在当今社会显得至关重要。当事人所录制的声音,以及声纹数据库,都能够得到妥善保护,确保身份安全不会泄露。

    四、终身认证

    正因为声纹的“独一无二、不可取代”性,社保中心只需一次建档,便可终身认证,系统可在几秒钟做出精确判断,让身份安全如同进了“保险箱”。

    尽管声纹识别技术目前仍遇到了诸如声音合成、录音重播、声道变化、背景噪音等现象的干扰,但随着技术持续不断地发展,相信克服这些问题指日可待,声纹识别技术将更为人们熟知,并在常识认知和日常运用中广泛推广。

    北京君林科技股份有限公司,是在电声行业技术领先的高科技公司,君林科技在声学、无线音频、AI声学、声纹技术、云端、语音大数据以及人工智能领域均处于行业领先位置,提供先进的解决方案和专业的服务,推动人工智能技术产品落地, 打造人工智能时代的金耳朵。

    公司凭借声纹识别核心技术与银行、社保、公安以及智能硬件行业展开合作,提供如移动支付、远程办理、声纹安全识别、用户注册等解决方案,并迅速积累大量语音数据库,将在行业内形成强有力的竞争力。

  • 君林科技携手中国传媒大学,共建声纹数据库

    2018年1月09日来源: 君林科技

    近日,北京君林科技股份有限公司与中国传媒大学签订协议,二者将联合建设声纹数据库,这些声纹数据将应用于声纹识别技术的研究以及在银行、社保、公安、智能硬件等行业应用实施

    声纹识别这项技术的研究始于20世纪30年代,自60年代以来取得了令人瞩目的发展。尽管声纹识别技术的研究已有半个世纪之久,但是现有的声纹识别系统仍存在许多困难,在社会化、实用化等需求上无法达到要求。

    现阶段,国际上长期致力于语言相关资源大规模开发和共享的组织和机构有:美国的语言学数据联盟--LDC(Linguistic Data Consortium),OGI(Oregon Graduate Institute)以及欧洲的ELRA(European Language Resources Association)等。除少数声纹识别语音数据库之外,这些组织和机构开发的语音数据库大多是面向语音识别和语音合成等应用的,其中只有一小部分可以间接用于声纹识别的研究。

    而国内,近年来,已有中国科技大学、中国科学院声学研究所、中国社会科学院语言研究所等高校逐渐投入较大的人力和物力在建立声纹库。这些语音数据库均依据不同的使用目的而建立,缺乏统一的标准与体系,而造成语音资源的“浪费”。

    中国传媒大学相关负责人表示,“通过与北京君林科技联合建设声纹库,双方将对声纹采集设备的研制及标准的制定、高性能声纹检索引擎的研发、声纹采集标准体系的建立等方面提供可参考的数据支持。

    北京君林科技相关负责人表示:“声纹库的建立,将有利于公司在银行、社保、公安、智能硬件等行业应用实施。”

    据了解,北京君林科技股份有限公司,是一家拥有完全自主知识产权的声纹领域研发商、服务商和解决方案提供商,公司在声学技术、无线音频技术、声纹识别技术、语音识别技术、人工智能及大数据领域都处于领先水平,旗下产品在金融、社保、公安、智能硬件等多个行业,提供领先的解决方案和专业服务。公司凭借极高的声纹识别精准度,与银行、社保、公安以及智能硬件行业展开合作,提供如移动支付、远程办理、声纹安全识别、用户注册等解决方案。

    目前,声纹库建设已经进入了最后准备阶段,双方预计采集声纹样本在百万级别以上。

  • 海纳百川Data Warehouse 与 Data Lake

    2018年1月5日来源: 君林科技

    前两篇聊到了大数据的编程语言python和计算框架Apache Spark,有了它们就可以写程序跑应用了,当然花点时间入门是必须的。如果你已经读完前两篇的话,那么不妨再继续聊聊数据仓库(Data Warehouse)和数据湖(Data Lake)。

    有一个严肃的问题,大数据存储和计算分析是为了啥? 只是为了单纯的炫技? 就如同个人电脑处理器的更新换代厂商总是不厌其烦的鼓吹“史上最快的CPU”。

    显然不是。这里得提一下商业智能(Business Intelligence),它是一套完整的解决方案,用来有效的整合企业数据,快速准确地提供报表并提出决策依据,帮助企业做出明智的业务经营决策。

    如何有效的整合企业数据? 粗糙点说,就是把企业相关的数据塞到同一个地方,结构化的,非结构化的,那么它就叫DataLake。 如果数据存放前已经经过清洗,聚合,标准化等等操作,那么它就是Data Warehouse。用时髦点的一句话来描述Data Warehouse: Single version of the truth。

    毫不夸张的说,Data Warehouse里的数据往往是公司非常重要的核心资产,也是黑客们垂涎已久的地方。得数据者,得天下;失数据者,必失业。自1990年Data Warehouse之父W.H.Inmon提出这个概念以来,Data Warehouse已经走过了近30年的历史,大量的商业公司不余其力在这个领域耕耘,因为这里的钱实在是太好挣了,IBM,Oracle, Sybase, Microsoft etc。

    当然每个公司运营管理这些DataWarehouse的Database Administrator(DBA)薪水也相当不错,地位也很高,算是个不错的职业。

    但随着数据量的越来越大,传统的Data Warehouse已经满足不了企业的商业智能需求。试想一下,CEO开会询问某新爆款游戏的用户使用情况,商业智能和数据仓库部门不得不如实回答还没开始在DataWarehouse里定义dimesions和fact,也就是还没开始收集和清洗数据呢。

    这样是不是挺尴尬。这时Data Lake的概念就派上用场了。来吧,什么乱七八糟的数据先发给我,我这儿是分布式存储HDFS(Hadoop的存储组件), 结构化的,非结构化的,来者不拒。有用的,没用的,先存着。以后需要了,再用ETL(Extract, Transform, Load)流程挖掘出来,然后存入DataWarehouse,Data Mart等等供后续分析。

    这样我们就能看出他俩流程上的一个明显不同,Data Warehouse是ETL,先清洗聚合在存储, 而Data Lake是ELT,先存储在清洗聚合。事实上,Data Lake在大数据的商业智能领域加速了整个流程,而且更加灵活,被越来越多的公司逐步采用。

    海纳百川,有容乃大。在大数据领域,如果Data Warehouse是海,那么Data Lake就是洋。

  • 大数据三分钟不入门之二: 一统江湖Spark

    2017年12月22日来源: 君林科技

    入门之一介绍了大数据的编程语言,想必有心的读者已经hello world了python的世界。好的开始是成功的一半,这篇我们来聊聊大数据重量级的开源计算框架ApacheSpark。

    也许有读者犯嘀咕,为啥没提Hadoop。当然得提,聊大数据不说说Hadoop则名不正,言不顺。大数据这十多年来的持续火爆与开源计算框架Hadoop的发展息息相关。在某种程度上,Hadoop就是大数据,大数据就是Hadoop。Hadoop解决了什么问题,为何说它推动了大数据的发展?

    举个例子,一根火腿肠,一个人一口一口咬着吃,这是单机操作。如果这根火腿肠100米长,最后这个人吃吐了,这就是存储和计算资源不足,内存溢出。换个人吧,还得吃到吐。如何更好更快的吃完这根大火腿肠呢?这里得感谢Google的一篇论文,激发了Yahoo工程师Doug Cutting的灵感,从而导致了Hadoop的应运而生。Hadoop里除了分布式存储外还实施了一个很重要的计算模型MapReduce。怎么理解它呢?回到吃火腿上,Doug从自己的名字获得启发,把这根火腿肠切成100份,然后在Yahoo社区发帖请来了100人,每人一段,免费吃。这样大火腿肠问题得到有效解决。同样的方法可以处理更长的火腿肠。大数据处理同样的道理。

    如果说Hadoop是第一代分布式开源大数据计算框架,那么发源于伯克利的Spark则逐渐成为事实上的第二代。Spark也采用了MapReduce模型,不同的是,Hadoop的Map与Reduce界限简单粗暴,中间数据采用磁盘作为临时存储空间。而Spark的数据大部分时间都在内存中,减少了磁盘的读写,速度得到大幅提升。它的MapReduce模型更加通用一些,同时也提供了支持SQL 2003标准的查询引擎SparkSQL,这对很多会SQL的数据分析师来说简直是一大福音。咱也能用SQL在Spark上跑大数据了。

    这些还谈不上一统江湖吧?机器学习和人工智能呢?图计算?支持实时流处理吗?如果使用Hadoop, 为了支持SQL得用Hive,机器学习得用Mahout, 实时流处理得用Storm......版图越来越大,系统组件越来越多,出问题的可能性也越来越大。而这些功能居然都集成在Spark里,一个框架解决了好几个痛点。这也是为什么Spark能成为了当下大数据计算框架网红的重要原因之一。

    潮起潮落,任何技术都有自己的辉煌和没落期,Spark正走向属于它的鼎盛时代。

    北京君林科技股份有限公司,是一家拥有完全自主知识产权的音频领域研发商、服务商和解决方案提供商,公司在声学技术、无线音频技术、声纹技术、语音识别技术、人工智能及大数据领域都处于领先水平,旗下产品在金融、社保、公安、智能硬件等多个行业,提供领先的解决方案和专业服务。公司凭借极高的声纹识别精准度,与银行、社保、公安以及智能硬件行业展开合作,提供如移动支付、远程办理、声纹安全识别、用户注册等解决方案,并迅速积累大量语音数据库,在行业内形成强有力的竞争力。

  • 大数据三分钟不入门之一:编程语言选择

    2017年12月13日来源: 君林科技

    现在大数据一片挺火,随随便便拉个公司就号称后台数据基础设施和商业智能是大数据模式,据说该公司的大数据可以用打印机打印出来校对。闲话少扯,最近很多朋友也问我大数据入门该学些什么,比如编程语言,工具,课程等等。在这里抛砖引玉,介绍我所理解的大数据和所需要的技能。如果不能入门,请再仔细研读标题三遍!

    大数据需要懂编程吗?太需要了,不管你是数据分析师,数据工程师,还是数据科学家等等。为啥?会有另外一篇介绍这些跟数据打交道的职位的共同与不同之处。此处暂且不论,因为在床上的阅读时间超过三分钟一定会影响睡眠。

    既然要学,学啥?如果你是编程小白,那你此时一定会很纠结,人生有时候选择太多也不是好事。随便列几个:sql, R, python, java, scala......

    什么?大部分都没听过。那就不用比较了,直接上python。还需要理由吗?

    首先,python属于解释型语言,边写边跑(REPL),上手简单。不像某些编译型“低端语言”,执行前还需要编译,动不动报一个类型错误,入门不易啊。当然Scala深谙此道,在改进java的基础上也支持REPL,可惜这哥们语言模型太生涩,抽象的厉害,凡人莫碰。题外话,很多大数据框架和工具都是这哥们写的,比如大名鼎鼎的Spark, Kafka, Flink等等。

    其次,上面提到的以及重要的大数据框架都支持python接口。你想想,费了九牛二虎之力学会了php, 准备在大数据领域大展身手,结果发现这个领域的重量级框架和工具都不支持,虽然都姓p,但差别还真蛮大。另:适用领域不同,不意味挑起任何语言争端。

    再次,python的数学统计和图形工具后来居上,大有超越R之势。不可否认R在开源统计分析编程语言里一直独占鳌头,但随着python重量级的数学和统计库的发布,以及dataframe的数据模型支持,大数据框架的广泛支持,R前景堪忧。这里不少数据分析从业人员估计会泪奔。

    最后,python的社区活跃程度非常高,背后还有干爹Google的大力扶持。想3分钟学会神经网络编程吗?试试我们的网红tensorflow吧。不过前提是你得会python。不会也没关系,这样你就不会被它的神经网络调优调出神经衰弱来...

    最后的最后,语言入市有风险,以上意见,仅供参考。

联系我们