科大讯飞人工智能主题大会暨2015年度发布会亮点全回顾!

科大讯飞 2019-01-16 21:39:22

A.I. 复始 万物更新

人工智能,未来就像水和电一样,无处不在。60年来,人工智能的发展经历了怎样的路径与起伏?以「讯飞超脑」为代表的科大讯飞人工智能技术,获得了哪些创新性、革命性的技术突破?又有哪些看得见,摸得着的产品能为我们的工作,生活,学习带来帮助?


作为被称为“人工智能之年”的2015年的收官大会,让我们一起回顾2015科大讯飞年度发布会全程,看科大讯飞如何解答以上问题,开启人工智能新纪元!




大会现场,来自人工智能科研前线、产业合作伙伴、开发者以及媒体界的3000余嘉宾使会场座无虚席。




在发布环节,刘庆峰发布了基于全新语音交互技术的人工智能时代的人机交互界面——AIUI,以及录音宝、录音笔、讯飞听见网、智学网、E 听说等To C产品,并对“讯飞超脑”2.0版本的近期科研成果进行了精彩介绍和现场演示科大讯飞高级副总裁、研究院院长胡郁,在大会上详细讲解了人工智能的科技起源、历史沿革与未来展望,以及科大讯飞产品的技术实现路径。本场大会由科大讯飞高级副总裁杜兰博士主持。



讯飞超脑正在认知智能方向不断突破


发布会伊始,科大讯飞董事长刘庆峰回顾了人工智能诞生整整60年来所经历的两次波峰波谷,对当下的人工智能热潮做出了精彩的评论。




刘庆峰表示,人工智能未来会像水和电一样无所不在。在人工智能的三个层次——计算智能、感知智能和认知智能之中,让机器实现认知智能是目前人工智能科研的焦点,这也是人区别于动物的最本质能力。


而从人类自身的发展来看,产生认知智能的标志是语言的广泛使用。所以,在第三次人工智能浪潮中,世界上众多的科学家都不约而同地从“自然语言理解”这个研究方向上,寻找人工智能的突破口,即从语音与语言入手实现机器的认知革命。而科大讯飞也正是从这个方向上取得了令世人瞩目的成就。


刘庆峰介绍,从1998年成功研发出可实用的中文语音交互系统开始,至2014年发布“讯飞超脑”的这17年间,科大讯飞取得了让行业和科技界瞩目的一系列科研成就与产业化成果。


科大讯飞的这些成果中,包括获得NIST全球语种识别比赛的冠军,JWSLT机器翻译评测冠军,在国内替代人工进行英语口语测试与普通话级别考试,并在教育、车载、家居、通信、硬件和国家安全等众多领域的产业化高速推进。这个过程中从一家大学生创业公司,成长成为目前市值超过500亿的中国高科技公司。


讯飞超脑全新升级 AIUI正式发布





在产品发布环节,刘庆峰首先定义了认知智能的三大核心支撑能力:人机交互、知识管理与推理学习。而随后科大讯飞发布的讯飞超脑2.0科研项目,正是围绕这三方面持续展开,不但赋予机器“能听会说”的能力,还能赋予机器“能理解会思考”的能力,使机器可以在不久的将来参加高考,并考上一本院校。


而在讯飞超脑的产业化应用产品层面,刘庆峰发布了对科大讯飞具有里程碑意义的人机交互新产品——AIUI。刘庆峰认为,在实际上已经到来的“万物互联”时代,客观上对人机交互提出了更高的要求。但是,一方面目前大多数设备没有屏幕并且与用户之间有一定的距离,另一方面随时随地的多方交互的需求越发明显。




于是,科大讯飞又在此次大会上定义了“万物互联”时代的人机语音交互标准,其基本能力应该包括三方面:远场识别、全双工、多轮交互。


AIUI集成了包括双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和内容服务等——科大讯飞一些系列尖端科研成果和完善服务,代表业界最高水准的技术产品。开发者将可以一键获取解决方案,通过集成麦克风阵列、集成SDK以及定制云端服务等方式。


用更自然的人机交互 打破山东大汉困境




也许你对年初那个被车载语音导航逼疯的山东大汉还印象深刻,一个普通话不标准的山东人,在环境嘈杂的车上,远距离与不那么智能的导航交流,产生的结果就是让人抓狂的识别与交互。而本次发布会上,科大讯飞通过远场抗噪、方言识别、全双工交互、多轮对话、纠错等系列技术,成功打破了山东大汉的困境。




科大讯飞通过定位、麦克风波束形成、回声消除、抗混响、唤醒一系列技术形成的系统解决了远距离识别问题。其次,科大讯飞实现了人机对话控制由单工(如手机语音助手的按一下说一下)转变成全双工(人和机器可以像打电话那样同时听和说)的交互转变。




多轮交互实现了机器对上下文连贯理解,使得人机交流不再是单调的一问一答,而是可以连续交流。再加上对话纠错机制,人可以随时纠正对话中双方的错误,使说过的话不再是覆水难收。通过以上一系列技术形成的系统,极大降低了环境、说法、习惯等对人机交互的干扰,实现高度自然的人机交互体验。


全学科阅卷&智学网 讯飞超脑助力教育升级


老师“忙”于改作业、判卷子、备授课,事倍功半;学生“盲”于做作业、找补习、问问题,低效重复;而教育资源“茫”,数量多、来源广,选择难,杂乱无章更是给教学带来极大困扰。刘庆峰用“忙”、“盲”、“茫”这三个字道出了教育面临的窘境,而科大讯飞目前的技术进展正是解决以上问题的良方。


刘庆峰表示,在讯飞超脑的应用层上,教育产业也是科大讯飞将自身科研成果产业化最成功的领域之一。目前,全国已经有31个省市的8000万师生在使用科大讯飞面向K12教育所推出的高科技教学与考评产品,有效解决了之前“老师忙、学生盲、资源茫”的教育行业困境,不仅实现了语音与文字的识别、合成与分类,并且实现了智能批改、全科阅卷、资源库自动建设等真正具备“人工智能”的产品目标,为中国的整个教育体系实现梦寐以求的个性化教学提供了有力支撑。





刘庆峰认为,正是在此基础上,作为科大讯飞的To C教育产品——智学网与E听说具备非常可观的市场价值。


目前,科大讯飞中文作文机器阅卷技术在2015年合肥、安庆中学会考上已经取得应用,人机阅卷对比结果显示机器阅卷已经比人工阅卷更准确!


刘庆峰表示,智学网秉承“基于大数据的发展性评价及教与学分析”的理念,以考试为切入点,可在线辅助老师完成出卷、阅卷、统分,将老师从繁琐重复的阅卷工作中解放出来。同时,机器阅卷过程的全数字化,实现对学生答题数据的收集,通过对数据的分析,生成面对学校、班级、学生不同版本的专业化评测报告,以便老师进行针对性的教学,进而促进学生实现个性化的学习,极大提升学习效率。


讯飞听见惊艳发布 即时语音转写开启知识管理新时代


在发布会现场,科大讯飞全球首次将演讲人董事长刘庆峰的演讲同步转写成文字在大屏幕显示,敢于接受现场数千参会者和数千万观看视频直播观众的检验。现场识别正确率几乎达到100%!引发阵阵惊叹,这也标志着科大讯飞又一次在业界率先实现了演讲和会议场景下的语音转写技术突破。





针对大型会议、现场采访、个人交流等场景下的内容整理需求,科大讯飞集成了单麦克解混响技术、阵列解混响技术、口语化识别等众多最新研究成果,全球首发智能“软件+硬件+服务”于一体的语音科技产品——讯飞听见,包括手机app(录音宝)、PC端网站(www.iflyrec.com)、智能硬件(录音笔)


PC端网站能够实现双屏智能编辑、角色自动分离、音频精准定位、快速按句回听、发言实时上屏、格式多种多样等功能,手机APP录音宝则能解决常见的录音回听不方便、导出录音复杂、录音文件无法重命名等问题。同时,听见录音笔既增强了传统录音笔的录音音质、播放效果,更配备智能语音转文字服务,三者的结合实现了“软件+硬件+服务”的完美统一。


刘庆峰表示,实际上,音文转写是当下都市生活的一种经常性需求,在正式发布之前,录音宝产品已经有了超过100万的用户就是这种需求的证明。而随着流媒体的不断演进与普及,相信,在未来的图文直播时代,科大讯飞的音文转录产品的价值将会更加凸显。


刘庆峰表示,录音宝、录音笔与讯飞听见网这三款新锐产品,将与讯飞输入法(2.8亿用户)、灵犀语音助手(1.2亿用户)、DingDong智能音箱(2015年市场份额最大的WiFi音箱)、智学网、E听说一道,构成科大讯飞的To C产品线第一阵营,而科大讯飞还将继续在To C业务的条线上,推出受市场欢迎的高科技产品。




随后科大讯飞高级副总裁、讯飞研究院院长胡郁则从技术层面详细阐述了讯飞超脑在过去一年里取得的阶段成果。一大波技术干货分享让与会者听得津津有味。





此外,科大讯飞的合作伙伴代表,NINEBOT、ROOBO科技、优必选也带来了精彩的分享。




本次发布会,以承前启后之势开启了中国人工智能的新纪元,将会是中国人工智能领域中一次具有标志意义的发布会。随着科大讯飞与产业合作伙伴们的共同探索,人工智能技术的突破将最大程度地延伸人类能力,不仅能替代简单劳动,也将能协助人类完成复杂劳动和白领乃至CEO的工作。


正如刘庆峰所说,在实际上已经到来的“万物互联时代”,语音为主,触摸、图像、手势为辅,将成为人机交互的新常态,而在这种人类生活的新常态中,人工智能技术的突破是用来延伸人类能力而非替代人类的。人工智能将使人类更幸福、更富想象力和创造力。




未来,科大讯飞将依靠自身强大的人工智能科研实力与优质产品,更具创造性地去改变世界,让人们的生活更加美好!


点击阅读原文 回顾现场直播