行业动态

当前位置:

新闻中心行业动态

产业智能化需要利器加持 王海峰携AI大生产平台亮相进博会

发布时间:2019-11-08  来源:中国新闻网

  11月6日,以“共创智能新生态,共享智能新时代”为主题的2019 智能科技与产业国际合作论坛在上海举办,这也是第二届中国国际进口博览会在智能科技与产业领域的唯一论坛。全球众多智能科技领域专家、企业领袖齐聚一堂,围绕人工智能领域的发展趋势、产业应用等热点话题展开探讨。

  继去年在第一届智能科技与产业国际合作论坛上分享AI领域前沿趋势后,今年,百度首席技术官、中国电子学会副理事长王海峰再次出席论坛,发表题为《AI大生产平台》的演讲,聚焦AI领域新趋势,并全面介绍百度打造AI大生产平台,加速产业智能化发展的经验。

  王海峰表示,去年人工智能就已经呈现出改变各行各业、推动新一轮科技革命的势头。当下,人工智能技术持续高速发展,并广泛地应用于我们的生产生活中,人工智能已经不仅仅是新的生产力,已经进入到工业大生产阶段。

  作为国内投入最早、技术最强、布局最完整的AI领军企业,百度持续研发领先的AI核心技术,并积极建设AI大生产平台,推动应用落地,促进产业智能化的发展。百度人工智能技术多年积累和产业实践的集大成——百度大脑,在技术层面已经进入“多模态深度语义理解”阶段,并实现了AI能力与应用场景融合创新,升级为“软硬一体AI大生产平台”。

  什么是“软硬一体AI大生产平台”?王海峰介绍,在基础算力和数据的支撑下,百度大脑以飞桨深度学习平台为基础技术底座,打通了人工智能产业化应用落地相关的全部流程,包括深度学习平台、通用AI能力、定制化训练平台、部署与集成,以及应用的技术解决方案,同时有完整的AI安全体系保障,实现了AI技术的标准化、自动化、模块化。

  人工智能的发展离不开算力的支撑。百度大脑的AI计算架构,通过芯片、连接、系统和调度的协同设计和技术创新,提供百万TOPS的强大算力,并紧密结合百度飞桨训练与推理框架,提供面向算法优化的极致效率。

  在算力层面,芯片间、节点间、计算与存储间的互联非常重要,尤其是5G的到来,也会带来新的互联。同时,芯片是受人关注的焦点。百度自研云端通用AI处理器——百度“昆仑”,针对语音、自然语言处理、图像等专门进行了优化,同等性能下将成本降低了10倍。此外,百度打造了远场语音交互芯片百度“鸿鹄”,依照车规级标准,采用HiFi4自定义指令集,双核DSP核心,具备超大内存,包含TCMCacheSRAM,而且能耗极低,平均功耗仅100mW,可实现远场阵列信号的实时处理和高精度低误报语音唤醒,并集成离线语音识别功能,适配车载语音交互、智能家居等各种场景。

  底层的芯片和上层的应用之间,还需要操作系统承接。在智能时代,深度学习框架向下对接硬件、芯片,向上承接各种业务模型、行业应用,起到承上启下的作用,是“智能时代的操作系统”。百度自主可控的飞桨深度学习平台,集深度学习训练和预测框架、模型库、开发套件、工具组件和服务平台等为一体,是功能完备、全面开源开放的产业级深度学习平台。飞桨平台核心技术领先,具备开发便捷的产业级深度学习框架、超大规模深度学习模型训练技术、多端多平台部署的高性能推理引擎、开源开放覆盖多领域的产业级模型库四大领先技术。

  11月5日召开的“WAVE SUMMIT+”2019深度学习开发者秋季峰会上,百度飞桨再次发布和升级了共21项功能或产品,易用性全面提升,在极大降低开发门槛的同时,面向产业应用的支撑能力更强。飞桨正成为加速产业智能化的重要基座。

  基于领先的算力、数据和飞桨深度学习平台,百度大脑的语音、视觉、自然语言处理、知识图谱等AI核心技术持续突破,世界领先。

  语音技术领域,百度大脑的流式多级截断注意力模型(SMLTA)使识别准确率提升15%-20%。王海峰现场展示了基于SMLTA中英文混合识别能力,这一能力目前已在百度输入法上大规模应用;风格迁移的语音合成技术把声音中的音色、风格、情感等不同元素解耦分离,独立组合,灵活控制合成的声音,只需录制20句话,就可以制作一个人的专属声音。基于此技术,百度上线了全球首个地图语音定制功能,为用户带来了前所未有的个性化体验。

  在视觉技术方面,百度已经形成了包括图像、视频、AR/VR、重要垂类、软硬一体化五大方向在内的特色视觉技术矩阵。OCR文字识别、物体检测、视频理解、目标跟踪等业界领先的图像与视频技术多次在国内外顶级赛事中取得佳绩,并已在机械制造、金融、医疗、教育等领域得到广泛的应用。创新的3D和AR视频交互技术,已经实现人脸、手势、环境、肢体多维度的技术突破,可用于一体化人机交互等创新应用。软硬一体化技术矩阵,则已经实现了包括模型开发、硬件实现、产品接入、应用场景在内的的一整套完备技术框架。

  在语言与知识技术方面,百度建立了完整的、包含知识图谱、语言理解、语言生成等在内的语言和知识技术布局,全面支持搜索、问答、对话等百度产品,同时开放赋能,支持各行业的创新应用。百度构建了世界上最大的多元异构知识图谱,在能够满足90%用户需求的实体图谱的基础上,针对不同的应用场景和知识形态建立起关注点图谱、行业知识图谱、POI图谱、事件图谱等多种知识图谱。

  自然语言处理技术也在持续创新突破。百度结合知识和语义理解打造的可持续学习的知识增强语义理解框架ERNIE,通过建模海量数据中的实体概念等先验知识,学习真实世界的语义关系。这种融合知识的语义建模大幅增强了模型的语义表示能力,在共计16个中英文自然语言处理任务上效果超越了谷歌BERT和XLNet;百度构建的面向任务的理解与交互技术,现在已经积累了6.8万个定制技能、累计交互570亿次,在车载交互、地图导航、智能音箱、政务咨询等诸多场景中得到广泛应用;而百度全面的语言生成技术,可以实现秒级自动生成文章,以及辅助创作全流程。

  随着AI技术的产业化应用不断深入,AI安全也受到越来越多的重视。百度大脑打造了完整的AI安全体系,从基础的开源技术矩阵、开放行业解决方案的平台,到与学术界、企业、政府、机构等多层面的开放协作,为AI技术的产业应用保驾护航。

  以百度大脑为核心,以飞桨为基础底座,依托百度智能云强大的ABC(人工智能+大数据+云计算)能力,百度持续赋能产业变革和创新。例如,百度的AI质检技术应用于工厂的质检车间,帮助人员成本节省90%,占地面积减少80%,将漏检率从0.5%-1%降低到0.1%以内;为重庆气象局打造的智能预报预测系统,可以覆盖短临、短期和气候预测,大幅提升气候预报的准确率、缩短气象预警信息的发布时间;与央视网携手进行国庆阅兵AI短视频生产,实现了从采集到合成几乎无人工操作。

  目前,百度大脑AI大生产平台已开放210多项核心AI能力,日调用量过万亿次,开发者超过150万,企业用户发布模型超过16.9万个。

  谈及未来,王海峰表示,人工智能将持续赋能各行各业,推动产业智能化升级,让我们的社会、我们的生活变得更加美好。

顶部 微信
扫一扫关注我们