百度大脑的“功夫”：语音及处理、图像、画像-科技世界网

资讯

科技世界网 > 科技资讯 > 网络

百度大脑的“功夫”：语音及处理、图像、画像

2016-09-01 13:58:07 来源：中国证券网

内容摘要

人工智能是百度核心的核心，过去百度花了很大的精力投入到人工智能，也就是之前提过的百度大脑。百度世界大会2016年9月1日召开，李彦宏在会上透漏了哪些人工智能的新风声呢？

百度大脑的“功夫”：语音及处理、图像、画像科技世界网

自2015年在国内首次实现城市、环路及高速道路混合路况下的全自动驾驶路测以来，百度无人车收获了国内外大量的关注，其在交通场景物体识别、高精度地图与定位等无人驾驶关键技术上的领先水平也得到了业界的广泛认可。

2016年9月1日，李彦宏在百度世界大会上介绍，百度大脑主要有四大能力，包括语音、图像、自然语言处理和用户画像等。在图像识别方面，百度人脸识别检测准确率已达99.7%，已应用在无人车、AR领域。

百度大脑是有三个大组成部分，第一个是人工智能的算法，模拟人的神经元网络，百度已经使用了万亿级的参数，人脑是千亿级的；第二个组成部分是计算能力，现在百度使用了数十万台服务器，不是基于CPU的服务，而是GPU；第三部分是数据，百度搜集了上万亿的网页内容，包括视频、音频、图像数据，百亿计的，每天数百亿次的网民定位请求。

具体来说，语音的能力包括语音识别能力和语音合成能力。

图像能力，指的是看到一个图片，不仅能看得见，还能看得懂。按照技术界的说法，它应该是计算机视觉。

自然语言处理能力，比语音和图像更难。语音和图像技术更多还处在认知的阶段，而自然语言理解除了要有认知能力之外，还需要逻辑推理能力、规划能力等等，同时也需要依赖于更为强大的知识图谱。

用户画像在传统的AI中并不是主流，但是今天，每时每刻都可以收集很多很多和用户行为相关的数据，就可以对用户做很好的画像，而这里面使用的技术又基本上都是与人工智能相关的。

百度无人车在行驶过程中，通过感知，可以探测到路面上车、路标以及各种各样的障碍物，每个物体有一个独特的编号，便于车对它进行识别。识别是通过百度大脑来识别的。

百度的图像智能识别技术帮助百度地图打破传统数据采集模式，实现了外业单人全景图像采集，使生产效率大幅提升。利用深度学习技术，采集设备可自动识别道路特征、提取建筑轮廓并绘制形状、识别道路图形标牌、电子眼、警示牌。图像智能识别技术能精准识别店铺名称、门牌号、停车场标识，甚至营业时间。

当前，百度地图的全流程数据生产自动化程度已超过80%，全景图像的自动化识别提取准确率高达95%。

图像识别的另一个应用领域是AR。据李彦宏透露，已经有广告主在挖掘AR在图像识别、用户感知和交互方面的应用。百度还将提出更多形式的AR互动，让技术落地消费者生活。

此外，在语音能力方面，百度大脑还在现场复原了一段张国荣原音，基于这种合成模式，人人都可以拥有自己的声音模型。

（如需转载，请注明来源自科技世界网）

关键字相关信息：

图说科技

科技热榜