http://www.barcelona-bb.com

通讯产品

时间:2020-01-24

图片 1

AI 技术的发展与应用落地如火如荼,智能时代的大幕正在缓缓拉开。上月,百度大脑在首期开放日上一口气开放了24项全新的 AI 技术,好评尚在业界传递。4月25日,第二期百度大脑开放日如约举行,本次共发布了13款 AI 通用新能力、5项技术升级,并推出了 EasyDL 商品检测专业版和语音识别自训练平台两大全新的可定制训练平台。

百度大脑已是服务规模最大的 AI 开放平台

百度大脑自2016年底开放以来,面向广泛的企业和开发者,提供最先进、最全面的 AI 能力,不断降低 AI 应用落地的门槛。截至目前,在百度大脑 AI 开放平台上,共开放了171项技术能力,实现24小时快速集成,开发者的使用量更是突破110w+,已经成为目前服务规模最大的 AI 开放平台。

在第二期开放日上,AI 技术生态部高级经理刘倩,向开发者们介绍了百度大脑整体的开放架构,并分别详解了有关深度学习框架、EasyDL 定制化训练与服务平台以及通用 AI 能力在语音方向、视觉方向、语言与知识方向等方面的技术和产品更新,以及与开发者们分享了百度大脑最新的落地案例。

前几天的首届 WAVE SUMMIT 深度学习开发者峰会上,百度大脑首次公布了 PaddlePaddle 全景图,AI Studio 重磅推出亿元免费算力支持计划。而在本期开放日现场,讲师再次对其进行了介绍,弥补了没能参加国内首场深度学习开发者峰会的开发者们的遗憾。除此之外,“AI 快车道-企业深度学习实战营计划”也在火热进行中,吸引了诸多企业、开发者前来询问了解。

语音、视觉、语言及知识方向全面升级,智能写作平台上线

在第二期开放日当天,无论是硬件、定制化平台,还是通用的 AI 能力,百度大脑不仅兑现了上个月立下的目标,还附带其他许多升级与新品,可谓又一次让开发者们满载而归。

在语音方向,推出基于端到端软硬一体解决方案的产品:远场语音开发套件。开发套件包含麦克风阵列和开发板,支持声源定位、噪声消除等信号处理算法,5米内有效拾音,支持远场唤醒、远场识别、语音合成能力,使语音开发评估更简便、更高效。这款新品基于 Linux 操作系统,主打高性价比的计算板卡 RK 3308,以及三角形3麦、线形4麦、环形6+1三种形态的麦克风阵列, 支持机器人、智能音箱、智能家居多种应用场景。此外,基于 RK 3326的更高性能开发套件也在研发中,性能更强可支持视频流的处理。

▲远场语音开发套件实物图

同时语音自训练平台正式上线,支持个人及企业开发者零代码自助训练语言模型,高效提升特定业务词汇/用语的识别准确率,支持语音助手、语音输入、智能客服等多种应用场景。此外,离线合成 SDK 也已上线邀测,满足无网或弱网环境下的 APP、机器人、硬件设备播报需求,提供稳定、一致的合成体验。

在视觉方向,新增加了人脸融合、车辆属性识别、车辆外观损伤识别、钱币识别、黑白图像上色、拉伸图像恢复、手部关键点识别等能力;而原有的 OCR 文字识别、更高精度的人像分割等能力也有了更新升级。同时,人体分析服务免费额度百倍升级,从500次/天升级至50000次/天免费调用,企业认证后更能获得5 QPS 不限量免费调用,更大使用量需求,价格低至200元/月/QPS,为企业和开发者带来实实在在的福利。

▲拉伸图像恢复

在语言及知识方向,智能写作平台全新上线,基于百度领先的自然语言处理和知识图谱技术,让 AI 赋能内容创作,提供自动写作和辅助写作的能力,全面提升内容创作效率和质量。而情感倾向分析也在此次开放日有了新的升级,在通用情感分析基础上支持零代码定制优化训练,同时也介绍了词法分析、评论观点抽取的定制化能力,可实现各细分场景下的效果提升。

EasyDL 落地更多场景,百度大脑生态赋能更多领域

第二期百度大脑开放日现场,讲师们还与大家分享了 EasyDL 的最新落地案例。

欣和是一家在高端鲜味调味料领域非常著名的公司。在面对陈列审核、货架数据、活动管理以及员工效率等工作场景中出现的难点,品览通过 EasyDL 商品检测版推出的品识商品识别平台,覆盖欣和全国1400个县的市场数据,可实时动态查看七种完美门店 KPI,审核人力节省了95% ,巡店效率提升80%。

而中科院与百度大脑合作,开创使用图像识别珍稀鸟类的项目让众人眼前一亮。据统计,中国拥有鸟类1400多种为世界第五,截至目前,利用鸟类识别模型,共筛选了20万幅图像,覆盖1000多个中国鸟类物种,使用 EasyDL 训练,目前1000多种鸟类模型 top 5准确率达到94.73%。其实,AI 还能够辅助生物多样性调查,建立生物知识图谱,生物安全模拟等,提高生物安全与预警,以更好地保护我国自然生态家园。

而在百度大脑和中国科学院遥感与数字地球研究所合作中,使用 PaddlePaddle Faster R-CNN 目标检测模型,构建共409景影像的865个多时相球场样本的全国标准高尔夫球场遥感数据集,应用深度学习技术比传统人工识别效率提升90倍。

百度大脑与开发者共同成长

随着百度大脑开放日的不断推进,越来越多的技术正在不断适应开发者的实际需求,这与开发者们积极的互动交流也有很大关系。当天,还宣布了第一期百度大脑新品体验师计划获奖名单,而第二期百度大脑新品体验师计划也在火热招募中。

参与百度 AI 社区交流与分享的开发者越来越多。为了鼓励开发者,百度大脑还专门设立了奖励机制,通过日常积分、品质积分等提升等级,并可以通过积分兑换百度大脑为开发者们准备的精心礼品。据介绍,自2016年启动开放后,百度大脑已成为服务规模最大的AI开放平台,开放了171种AI能力,可实现24小时快速集成,开发者数量超过110万。

继上个月的首场百度大脑开放日带来24项全新AI技术后,本次活动上,百度AI技术生态部高级经理刘倩又全面解析了百度大脑最新推出的13款通用新能力以及6项升级。

其中,蓝色部分为今日发布的新品,绿色部分为新升级的产品,最下方的三行白字是百度为开发者们发放的福利。

在发布今日的新能力和平台之前,刘倩先回顾了在本周二首届WAVE SUMMIT 2019深度学习开发者峰会上,百度不仅给唯一国产的深度学习框架PaddlePaddle赐了中文名“飞桨”,带来了PaddlePaddle 11项新特性及服务重磅发布,还宣布AI Studio亿元算力支持计划,供开发者们免费试用工业旗舰GPU。

上图黄色框标注了PaddlePaddle新发布或者重大升级之处。

其中,百度面向工业应用的中文NLP工具集PaddleNLP、业界首个视频处理PaddleCV、自动选取最适用的网络模型的工具AutoDL Design等新特性均相当吸睛。

一、EasyDL通用版全面升级,商品检测专业版发布

PaddlePaddle的服务平台中,除了前几日新发布的一站式开发平台AI Studio外,还有一款已经被广泛使用的定制化训练与服务平台EasyDL。

据介绍,EasyDL目前拥有超过1.5万个企业客户,已创建超过3万个模型。EasyDL可为开发者提供零算法基础定制高精度AI模型。相比AI Studio,它不需要使用者具备算法经验。在今日的活动中,百度不仅带来了EasyDL通用版的升级,还发布了商品检测专业版。

1、通用版升级:支持多人标注,升级离线SDK服务

物体检测需要实时在线标注,而数据标注通常任务量大,需要多人协同完成,而且数据标注人员和模型开发人员往往不是同一个账号。针对这一问题,EasyDL物体检测模型全新支持多人标注,大幅提升标注效率。另外,刘倩强调,不管多高效的工具,采集设备的一致性、数据的一致性、使用场景的一致性都很重要。如果训练和测试使用的设备、数据类型不一致,那么训练出优秀的模型是不现实的。对此,EasyDL通用版将离线SDK服务全面升级,提供更高精度算法、更全平台支持以及灵活的授权方式。

2、商品检测专业版:高效处理,完备配套工具

据悉,EasyDL一个重要场景是商品检测,超过10%的用户在EasyDL通用平台上,训练零售场景的商品检测识别模型。线下商品数数字化是新零售转型的首要环节,而用AI技术实现商品检测与识别时商品数字化的有效手段。商品检测在EasyDL通用版会遇到商品种类繁多、放置方位不确定、拍摄角度和光线不同、目标商品与非目标商品混杂、难以一次拍摄货架全景等问题,致使存在大量样本数据、复杂数据标注和模型适应性差等难点。为了解决零售行业存在的这些难题,EasyDL全新推出商品检测专业版,在通用版的基础上,结合了行业洞察的数据、算法、工具、预制技能等一系列服务,实现更高效的AI模型生产。

EasyDL商品检测专业版能极大降低数据采集和标注成本,主要特性包括:

预置海量SKU商品图库

平台提供600个常见SKU多角度单品图片数据,覆盖饮品、日用品、调味品和零食四大品类,即将扩展至2000个。

自动图像合成

自动图像合成可高效生成大规模样本,丰富货架场景,使得模型适应性增强。

SKU图像采集箱

SKU图像采集箱用于快速获取新增单品SKU多角度图像,这一特性即将推出。

在算法层面,EasyDL商品检测专业版提供贴合场景的算法和配套工具,同样包含3类:

专项算法调优,包括基于大规模商品预训练、面向零售场景优化、面向超大分类优化等。

场景化模型选择,4种商品预测场景被预置,包括普通货架/货柜、自助结算台、无人零售货柜和地堆商品,供用户根据实际业务需求灵活选择。

货架拼接SDK,该特性也即将发布,用于解决实际应用中无法一次拍摄货架全景的问题,模型自动实现拼接、排重和商品检测计数。

当前,EasyDL商品检测专业版已经在线上开放。

二、语音开放能力:新福利、新产品、新平台

在语音开放能力方面,今日百度大脑不仅带来了一项福利,推出2款新产品和1个新平台和,还提前预告了将在5月发布的新品。

1、发福利:限时极速版增额服务

第一个福利是百度的语音识别服务,输入一段小于60秒的音频,即可输出文字结果。在6月前,百度将向每个用户免费额外赠送5万次调用量,如果用户进行实名认证,再送20万次调用量,如果开通付费并产生1次付费调用,将再加送50万次调用量。也就是说,每个用户最高可获得近80万次的免费调用量。

2、新产品:远场语音开发套件

紧接着,百度展示了一组新产品——远场语音开发套件RK3308,三款麦克风阵列规格适用于多种业务场景,包括音箱、机器人、平面型家电、PAD、车载设备等。一套开发套件价格为1299元,已经上线AI市场。

3、新平台:语音自训练平台

通用语音识别模型在垂直场景表现参差不齐,针对性优化训练成本高、耗时长。对此,百度推出语音自训练平台,零代码自主训练语言模型,帮助业务场景获得更高效地获得更好的识别效果,应用场景有语音助手、语音输入、智能客服等。基于百度多业务积累的基础模型,语音自训练平台拥有四大核心优势:

简单:全流程零代码自主完成,上传文本即可训练,训练前后准确率对比评估科学直观。

灵活:支持词汇、长文本等多种训练方式。

有效:业务用语识别有效提升5%-15%准确率。

可靠:模型专属使用,稳定性高。

4、新产品:语音合成离线SDK

为了满足无望或弱网环境下的APP、机器人、硬件设备播报需求,提供稳定、一致的合成体验,百度推出语音合成离线SDK。该产品首先发布安卓版本,iOS版本也将马上推出。其音库支持4个发音人,并在持续增加中。其授权方式支持按设备授权、产品线授权。

5、5月新品预告

百度还提前预告了将在5月发布的新品,包括语音合成5个新音库和呼叫中心语音解决方案。呼叫中心语音解决方案则是转为呼叫中心业务场景提供语音能力,包括呼叫中心专属语音识别模型、专属合成发音人,应用场景有电话销售、智能外呼、客服质检等业务。

三、视觉方向:新福利、新能力、新升级

视觉方向是本日百度大脑公布新能力和新升级最多的一个方向,共有6项新能力发布和4款能力升级。

1、发福利!人体分析服务免费调用额度升级

百度大脑视觉方向首先公布的好消息也是发福利,包括人体关键点识别、人体检测与属性、人流量统计、人像分割、手势识别在内的人体分析服务免费调用额度升级:从1天免费500次,升级为1天免费50000次,超额部分200元/月/QPS起,这个价格在业界还是很有竞争力的。企业认证后,还可以享受5 QPS不限调用量。

2、6个新能力

除了发布福利,百度大脑还带来了视觉方向的6个新能力:

人脸融合:对两张人脸进行融合处理,生成同时具备2长人脸外貌特征的人脸图像。

车辆属性识别:识别图像中的小汽车、卡车、巴士、摩托车、三轮车、自行车,可识别小汽车的11种属性。

车辆外观损伤识别:针对常见小汽车车型,可识别数十种车辆部件、五大类外观损伤。

钱币识别:支持数百类币种、数千种面额,识别准确率98%以上。

黑白图像上色:将黑白图像上色成彩色图像。

拉伸图像恢复:自动识别过渡拉伸的图像,将其恢复成正常比例。

3、4款新升级

另外,百度大脑对4款能力进行升级,包括OCR文字识别、红酒识别、人像分割。其中,OCR文字识别支持最新营业执照的识别,增殖税发票识别平均相应时长降至原来的1/3,四要素识别准确率高达99.9%,支持发票全部31个字段。红酒升级整合红酒信息服务应用“酒咔嚓”的专业数据,识别结果增加产区、糖分、葡萄品种、品尝温度等更丰富的信息。人像分割的精度也得到大大提升,模型IoU从93.6%提升到96.5%。

四、语言和知识:新升级、新优化、新平台

百度大脑在语言和知识方向宣布的第一款升级为情感倾向分析支持定制训练。如图所示,通用型情感倾向分析在任何场景或应用得出的情感倾向都是一样的,而定制化分析则可以在餐饮服务种判断偏正向,在手机配件中判断偏负向。另外,百度大脑带来自然语言处理3个支持定制优化的能力:定制情感分析、定制词法分析、定制评论观点抽取。

针对自动写作和辅助写作的需求,百度大脑推出新平台——智能写作平台。自动写作应用包括智能写诗、智能春联以及视频、图文转换的多模写作。

辅助写作的应用主要有观点抽取、情感分析、关键词热度趋势、关联分析等,帮助用户在创作前辅助选题、激发灵感,还可以帮助推荐创作素材和丰富内容,以及进行成文后的有文本纠错、质量检查等任务。

百度大脑已全面开放了底层技术、开源深度学习框架、通用AI能力、定制AI能力平台、硬件开放平台、AI市场等多层次的百度大脑作为国内全面性和领先性都属于业界翘楚的AI开放平台,正在为越来越多的开发者带来更为简单易用的AI开发体验。

据刘倩介绍,目前百度大脑很多能力免费开放,超额部分收费。百度大脑对开放能力非常慎重,小规模邀请测试是免费的,目的是验证真实场景可用性;大范围应用推广的窗口期也是免费;得到大面积验证后,再考虑商用收费。

如今,我国在海量数据和大规模市场应用方面拥有明显优势,AI技术的商业化落地进程也正在快马加鞭。早早嗅到AI技术商业变现机遇的百度,已经编织出一张超级AI巨网,面向越来越多的行业和场景提供持续升级的智能化服务,助推产业变革。

技术更新、新品上线、开发者现身说法、行业案例详细解读、交流互动社区、培养激励措施......百度大脑希望与开发者一起推动百度大脑进化,帮助他人一起成长,探索 AI 前沿应用。第二期百度大脑开放日可谓干货满满,诸多的惊喜让开发者们觉得不虚此行。就在活动结束之前,还有彩蛋赠送,智能对话引擎与产品发布会即将召开,这让众多开发者更是对百度大脑充满期待,今后究竟以后还会有哪些意想不到得精彩,让我们拭目以待吧!

文章来源:百度AI