AI开发者的年终盛宴!百度飞桨八大重磅发布,螺旋桨来了!

智东西(公众号:zhidxcom)

作者 | 李水青

编辑 | 漠影

“技术道路如此崎岖漫长……你热爱的代码……这世界因程序员激荡(www.imrr.cn)。”

在一曲程序员版的《曾经年少轻狂》摇滚歌声中,WAVE SUMMIT+2020深度学习开发者峰会今天在北京启动。

智东西12月20日报道,在这场人工智能领域的年终盛宴上,百度为开发者带来了八大全新发布与升级包括

生物计算平台“螺旋桨”、飞桨开源框架V2.0RC版、端云协同的AI集成开发环境BML CodeLab三大新发布,更强大规模分布式训练、开源算法库增至200+、智能数据服务平台EasyData升级三大升级,最新飞桨硬件生态路线图“大航海”计划

百度深度学习框架飞桨(PaddlePaddle)于2016年正式开源,成为中国首个开源开放、功能完备的产业级深度学习平台,使得国产深度学习框架在谷歌、Facebook等国际巨头的包围中占据一席之地。

几年后的今天,飞桨已经越来越强调产业生态和真实落地价值。

大会开场,百度CTO王海峰公布了一组关于飞桨的统计数据:飞桨累计开发者数量已超过265万,基于飞桨训练的模型超34万,服务企业累计超10万家。而在2020年5月份上半年的WAVE SUMMIT 2020深度学习开发者峰会上,这些数字还是190万、23万、8.4万,可见扩张迅猛。

本次会上,包括宁德时代新智能制造部部长张伟、昆仑数智人工智能与物联网技术总监卫乾都带着智能落地的丰硕成果进行了报告,并同多家互联网、工业、金融、交通等多行业的企业一同获得“飞桨产业应用创新奖”。

除此之外,百度集团副总裁吴甜等人也带来了飞桨在技术更新、产业生态、人才培养等方面的最新进展。

一、3大发布3大升级、1大路线图、1个“大航海”计划

近半年,飞桨有什么样的新进展?话不多说,首先让我们看三大全新发布。

1、生物计算平台:PaddleHelix螺旋桨

PaddleHelix螺旋桨生物计算平台将先期开源工具集包括RNA二级结构预测、大规模的分子预训练、DTI药物靶点亲和力预测以及ADMET成药性预测等,面向生物信息领域智能交叉学科的学习者、研究者、工作者们提供称手工具。

其实,在今年疫情期间,百度研究院开发的线性时间算法linearflod就面向全球进行了公益开放,不久后免费开放了全球首个mRNA疫苗基因序列设计算法LinearDesign,在人工智能技术和生物计算领域进行尝试探索。近期以百度为发起单位的业内首个生物计算平台的技术标准也在人工智能产业协会联盟大会上进行了立项。

2、飞桨开源框架V2.0RC版:支持动静统一的编程范式

百度深度学习技术平台部高级总监马艳军带来飞桨开源深度学习平台的全新发布——开源框架V2.0RC版,支持“编程一致、动静统一”的全新开发体验。

所谓的动静统一就是用动态图组网,方便调试编程,能够一键或者用一个非常简单的代码就可以转成静态图去训练部署,从而兼顾两种编程范式的优势。

动静统一的编程体验有几个特点:1、功能更加完备,支持Python语法。2、操作简单,只需要加一个装饰器,一行代码可以转成静态图部署。3、存储模型的接口大量完善,使得静态图存储模型,也能用动态图加载。

2.0版本的另一大升级是全新API体系,具有体系化、简洁性及兼容性几大特点。全新升级的API体系新增200多个API,融合高层API和底层API,实现低代码开发,并能支持企业开发者实现顺畅的程序迁移。

马艳军称,飞桨开源框架V2.0RC版的编程体验可以更好支持深度概率编程、量子机器学习等更多的前沿研究和探索。

3、AI集成开发环境BML CodeLab:50多项体验优化,端云协同

飞桨企业版包括两大AI开发平台,一个是针对AI应用开发者的EasyDL零门槛AI开发平台,另一个就是针对算法开发者的BML全功能AI开发平台。

本次,百度AI平台研发部总监忻舟隆重介绍了全新的端云协同的AI集成开发环境BML CodeLab。BML CodeLab是一个本地的开发环境和客户端。它解决的主要问题是,现在市面上还没有一个很好的针对于AI研发的本地客户端。

简单来说,今天发布的BML CodeLab基于JupyterLab实现了50多个体验的优化项目,提升开发体验;开箱即用的客户端内置飞桨文心(ERNIE)NLP套件及单机高性能技术引擎,还可无缝扩展到云端。

除了三大全新发布,本次百度还带来了飞桨全平台的三大升级。

1、大规模分布式训练升级,推出首个通用异构参数服务器架构

本次,百度还正式推出大规模分布式训练的升级,带来业内首个通用异构参数服务器架构。

马艳军公布了一组数据,通过测试,异构参数服务器架构在相同的硬件下,比单纯的非异构的硬件能够提升65%以上,同时用2个CPU+2个GPU就可以达到4个GPU相应的速度,提高性价比。

2、飞桨企业版:智能数据服务平台EasyData添新功能

在飞桨企业版方面,本次百度带来了智能数据服务平台EasyData的重要进展,包括大幅提升智能标注的效能,新增多人标注能力以及高级智能清洗能力。

其中,智能数据标注功能升级使得标注时长平均减少了74%,物体检测和图像分割上分别提升了6.4和3.2个点。多人标注能力也是响应市面呼声,满足团队协作标注需要。在高级智能清洗能力下,飞桨可以基于AI算法对安全生产、视频监控场景中的无效样本进行过滤,助开发者提升数据标注效率。

3、开源算法库升级:140个算法扩充到200+个

今天百度另外一个大升级是开源算法库同步升级。据悉,开源官方支持的算法从140个扩充到200+个。大多数算法都已升级为动态图实践,使开发者二次开发更加容易。

值得一提的是,会上百度还正式推出飞桨硬件生态路线图。从图中可知,飞桨目前跟二十家芯片硬件企业达成合作,目前正在适配和已完成适配的芯片和IP型号已有29种,并且在国产的芯片支持上遥遥领先。

可以看到,我们熟悉的英特尔、华为、曙光、英伟达、龙芯、比特大陆等CPU、AI芯片、FPGA等各领域的硬件厂家都在其中。

除此之外,本次百度基于飞桨产品、技术、生态的全面积累,还发布了飞桨“大航海”计划。此次发布围绕高校人才培养的启航计划,百度承诺未来三年飞桨将投入总价值5亿元的资金与资源,支持全国500所高校,重点培训5000位高校AI教师,联合培养50万AI未来人才

二、飞桨社区开源贡献者超5000位,硬件生态伙伴达20家

会上,开发者们的老朋友百度CTO王海峰如约发表了自己2020年对行业的最新前瞻看法

王海峰说,开源开放已经成为驱动技术创新和加速产业发展的核心动能。

他欣慰地细数,当下大量先进的科技论文都基于开源开放的深度学习框架共享成果,其中有众多是中国科研人员和开发者的贡献,而同时开源也在加速产业的发展。围绕开源开放成熟的技术生态与开放平台,社会各界正在加快融合发展。而聚焦到百度飞桨深度学习平台,王海峰高兴地分享了最新成果:飞桨平台迄今为止凝聚了265万开发者,服务了10万家企业,创造了34万个模型。

王海峰最后还颇为动情地说,开源开放已经成为推动技术创新和产业发展的核心动能,而驱动这股核心动能的其实是我们每一个人,也包括我们在座的每一个人。

人工智能开源开放的背后驱动力来自于每一个开发者。百度集团副总裁吴甜鲜活的案例让我们对此有所感知。

她讲述了几位开发者的故事,年龄13岁的最小开发者、累计贡献3600行代码的芯片工程师、在飞桨社区累计答疑12000次的答疑达人等,这些开发者让我们看到了飞桨上的人工智能贡献者已经突破了年龄和职业的限制,这是当下中国产业智能化进程中一股非常庞大的群体和力量。

而后吴甜公布了一组数据:飞桨社区开源贡献者超过5000位,发展飞桨开发者技术专家(PPDE)97位,成立了7个兴趣小组,有132个城市或高校有自组织社区在自发的进行飞桨社区活动的开展。

硬件生态方面,飞桨的硬件生态伙伴目前有20家,已经完成适配或者正在适配的IP类型号有29种

产业应用方面,飞桨服务了10万企业,覆盖到了金融、教育培训、交通处行等等各行各业,飞桨平台上已经创造了有34万模型,这每一个模型的生产其实都代表着一次人工智能技术和产业的结合落地产生价值。

人才培养方面,飞桨师资培训覆盖到500所高校,支持了200多所高校开设AI学分课程,飞桨的AI大赛覆盖到全球五大洲22个国家580所高校。今年自疫情以来,我们加大了线上直播课程的建设,今年已经开设了有176次直播课程,在AI Studio上进行学习的人次超过了290万

从这些数据中,我们看到了整个智能时代勃勃跳动的脉搏。

三、宁德时代、昆仑数智等专家带来飞桨落地“实战经”

目前,飞桨已经落地应用到各行各业。

宁德时代新能源电池高精度质量检测案例为例,2019年宁德时代开始深度学习技术的研究,通过百度飞桨提升检测精度及预测效率达到实际生产需求。

宁德时代新智能制造部部长张伟说:百度对企业支持提供了非常好的套件,便捷的部署和对人才的支持。(基于飞桨)我们取得了非常显著的进步,整条产线原来通过人工质检的工作,现在都用智能化平台取代了。在非常复杂的设备,面对不同的化学材料,都可以通过深度学习算法来进行检测识别

而在昆仑数智的油气勘探项目中,公司梦想云平台基于飞桨(PaddlePaddle)AI框架为现有业务提供AI能力的支撑,推动油气行业从万物互联到万物智联的过渡。

昆仑数智人工智能与物联网技术总监卫乾说:“坦率地讲,人工智能技术几乎可以适用于石油能源行业的每一个环节”。而后,卫乾讲解了工人施工安全检测、大型机装设备的故障诊断、油气生产优化等油气勘探地多方面应用。

当然,飞桨在产业的落地远不止这些,从后面的“飞桨产业应用创新奖”颁奖情况就能体会到。会上,除了以上两家企业,还有来自智能工业、互联网、金融、交通等多个行业的企业和案例都获得了相关奖项。

结语:国产AI开源框架产业生态日益壮大

可以看到,这个中国首屈一指的开源深度学习框架生态已经越来越显示出蓬勃生机,与各行各业的智能化变革产生深度联系。

在这场牵动265万AI开发者的年终盛会上,百度飞桨推年度三大全新发布、三大更新,并亮出了飞桨产业应用、人才培育、开源共建几方面的进展,对AI人来说无疑是冬日里的一场暖阳盛宴。而一个个开发者的努力贡献,带来的将是整个AI产业化、产业AI化的进程。

主营产品:熔断器,保险器,温控器