首页 > 知识库 > 正文

飞桨[百度深度学习平台PaddlePaddle中文名]是什么 关于飞桨[百度深度学习平台PaddlePaddle中文名]的详细介绍

PaddlePaddle是百度自主研发的集深度学习核心框架、工具组件和服务平台为一体的技术领先、功能完备的开源深度学习平台,有全面的官方支持的工业级应用模型,涵盖自然语言处理、计算机视觉、推荐引擎等多个领域,并开放多个预训练中文模型。目前已经被中国企业广泛使用,并拥有活跃的开发者社区生态。 PaddlePaddle同时支持稠密参数和稀疏参数场景的大规模深度学习并行训练,支持千亿规模参数、数百个节点的高效并行训练。PaddlePaddle拥有多端部署能力,支持服务器端、移动端等多种异构硬件设备的高速推理,预测性能有显著优势。目前PaddlePaddle已经实现了API的稳定和向后兼容,具有完善的中英双语使用文档。

发展历程

百度深度学习大事记

• 2012年,百度将深度学习技术应用于语音识别、OCR等。

• 2013年,百度开始研发深度学习框架PaddlePaddle,搜索、凤巢CTR预估上线DNN模型。

• 2015年,百度发布全球首个NMT在线翻译引擎,基于LSTM-CTC的声学模型上线,开始自研更适配 NLP任务的通用深度学习框架。

• 2016年,在百度世界大会上,百度宣布PaddlePaddle开源,这标志着国内第一个开源深度学习平台的诞生。

• 2017年,百度信息流推荐系统使用深度学习,并发布了新一代深度学习框架Paddle Fluid。

• 2018年,PaddlePaddle 3.0升级为全面的深度学习开发套件;百度视觉模型、强化学习在 ActivityNet 2017/2018 kinetics、Google AI Open Images-Object Detection Track、NIPS AI for Prosthetics Challenge 等多项国际比赛中夺冠。

• 2019年,首届WAVE SUMMIT深度学习开发者峰会在北京召开,PaddlePaddle深度学习平台全面升级,发布中文名称:飞桨 [3] ;PaddlePaddle助力百度视觉团队在多目标追踪挑战的MOT16和ICME人脸106关键点检测比赛中夺冠。 [4]

PaddlePaddle 核心框架版本迭代

• 2018年 7月,Paddle Fluid v0.14发布——提供从数据预处理到模型部署在内的深度学习全流程的底层能力支持。官方首次开源CV/NLP/语音/强化学习等10个模型。 [5]

• 2018年 10月,Paddle Fluid v1.0稳定版本发布——提供更稳定、向后兼容的API,易用性大幅提升。提供 MacOS 下的多种安装方式,新增对Python 3.5的支持。并开源8个CV、NLP 方向主流模型。 [6]

• 2018年11月,Paddle Fluid v1.1发布——支持千亿规模稀疏参数大规模多机异步训练。移动端预测新增Mali GPU、Adreno GPU、FPGA等硬件支持。开源5个推荐领域模型,大幅优化CV、NLP模型的训练速度和显存占用。 [7]

• 2018年12月,Paddle Fluid v1.2发布——CPU多机异步训练升级包括worker异步并发和IO、通信优化在内多项功能,整体吞吐大幅提升。支持Python 3.6及以上全版本。模型库新增图像分类任任务的预训练模型、语言模型任务新增基于cudnn的LSTM实现、分布式word2vec模型。 [8]

• 2019年3月,Paddle Fluid v1.3发布——统一Executor和ParallelExecutor接口,正式发布AnalysisConfig 预测接口,支持计算图分析、算子融合等优化;模型库新增发布PaddlePaddle视频模型库,提供5个视频分类经典模型以及适合视频分类任务的通用骨架代码;新增支持NLP语义表示BERT模型,支持多机多卡训练,支持混合精度训练,训练速度对比主流实现提升50%+;发布大规模稀疏参数服务器Benchmark。 [9]

• 2019年4月,Paddle Fluid v1.4发布——正式发布模型压缩工具包PaddleSlim和模型预测服务Paddle Serving,全面提升PaddlePaddle部署能力。正式发布视频分类工具包,覆盖主流视频分类模型;正式发布PaddleNLP,工业级中文NLP工具与预训练模型集。正式发布PaddleHub预训练模型管理工具,提供包括预训练模型管理、命令行一键式使用和迁移学习三大功能。发布业界顶尖超大规模并行能力,包括大规模稀疏参数服务器解决方案、工业级数据处理、带宽不敏感训练能力等。 [10]

产品优势

工业级中文 NLP 算法和模型库

涵盖文本分类、序列标注、语义匹配等多种NLP任务的解决方案,拥有当前业内效果最好的中⽂语义表示模型和基于用户大数据训练的应⽤任务模型,且同类型算法模型可灵活插拔。

强大的百度NLP工具集

强大的百度NLP工具集

支持稠密参数和稀疏参数超大规模分布式训练

支持稠密参数和稀疏参数超大规模分布式训练

支持稠密参数和稀疏参数超大规模分布式训练

基于百度海量规模的业务场景实践, PaddlePaddle同时支持稠密参数和稀疏参数场景的超大规模深度学习并行训练,支持千亿规模参数、数百个节点的高效并行训练。

端到端的全流程部署方案

覆盖多硬件、多引擎、多语言,预测速度超过其他主流实现。同时,还提供了模型压缩、加密等工具。

端到端的全流程部署方案

端到端的全流程部署方案

丰富的配套工具组件

提供AutoDL Design、PaddleHub、PARL、VisualDL、EDL组件。

完整的中文文档

PaddlePaddle 是首家完整支持中文文档的深度学习平台。文档覆盖安装、上手和 API 等,为国内开发者建立了友好的生态环境。

核心技术

PaddlePaddle是集深度学习核心框架、工具组件和服务平台为一体的技术领先、功能完备的开源深度学习平台。

PaddlePaddle全景图

PaddlePaddle全景图

核心框架Paddle Fluid

Paddle Fluid提供覆盖深度学习开发、训练、预测及部署全流程的服务。

特点一:提供丰富的官方支持模型集合

PaddlePaddle开源了经过60多个真实业务场景验证的官方模型,涵盖视觉、NLP、推荐等AI 核心技术领域,是官方支持模型最多的深度学习平台。

PaddlePaddle官方支持模型

PaddlePaddle官方支持模型

特点二:超大规模并行深度学习平台能力

提供多机CPU 参数服务器训练方法,全面支持大规模异构计算集群,同时支持稠密参数和稀疏参数场景的超大规模深度学习并行训练,支持千亿规模参数、数百个节点的高效并行训练。

特点三:高性能部署和集成方案

提供Paddle Serving和Paddle Mobile推理引擎,两行Python代码可调用的自动化模型压缩库。

工具组件

PaddleHub

PaddleHub是预训练模型管理框架,通过命令行接口,便捷获取PaddlePaddle 生态下的预训练模型; 无需编写代码,命令行一键完成预训练模型预测;借助PaddleHub Finetune API,使用少量代码就可完成迁移学习。

PARL

PARL是基于PaddlePaddle的深度强化学习框架,具有高灵活性和可扩展性,支持可定制的并行扩展,覆盖DQN、DDPG、PPO、IMPALA 、A2C、GA3C 等主流强化学习算法。通过8 块GPU 拉动近20000个CPU 节点运算,将近5 个小时迭代一轮的PPO 算法加速到不到1 分钟。

AutoDL Design

AutoDL Design可以让深度学习来设计深度学习,AutoDL 包含网络结构自动化设计、迁移小数据建模、适配边缘计算三个部分。开源的AutoDL Design 网络结构自动化设计技术设计的图像分类网络在CIFAR10 数据集正确率达到 98%,效果全面超过人类专家,居于业内领先位置。

VisualDL

VisualDL是深度学习可视化工具库,它可以帮助开发者方便地观测训练整体趋势、数据样本质量、数据中间结果、参数分布和变化趋势、模型的结构,更便捷地处理深度学习任务。

服务平台

AI Studio

百度AI Studio是一站式深度学习开发平台,集开放数据、开源算法、免费算力三位一体,为开发者提供高效学习和开发环境、高价值高奖金的竞赛项目,支撑高校老师轻松实现AI教学,并助力企业加速落地AI 业务场景。 [11]

EasyDL

EasyDL 为零算法基础的企业用户和开发者提供高精度的AI 模型定制服务,已

在零售、工业、安防、医疗、互联网、物流等20 多个行业中落地应用。 [12]

应用及落地

案例1:AI识虫

红脂大小蠹是危害超过35 种松科植物的蛀干害虫,自1998 年首次发现到2004 年,发生面积超过52.7 万平方公里, 枯死松树达600 多万株。且在持续扩散,给我国林业经济带来巨大损失。AI 识虫是北京林业大学、百度、嘉楠、软通智慧合作的面向信息素诱捕器的智能虫情监测系统。

应用方案:

通过PaddlePaddle训练得到目标检测模型YOLO v3识别红脂大小蠹虫,远程检测病虫害情况。

AI识虫应用方案

AI识虫应用方案

这套检测系统的应用大幅降低虫情监测的人力成本,识别准确率能达到90%,原本一周的工作量只需一个小时即可完成。

案例2:标准高尔夫球场自动检测

随着高尔夫球运动在我国的兴起,关于高尔夫球场大量占用土地资源、污染环境、耗水量大且公益性差的争议越来越多。开展高尔夫球场用地监测,对发现新增高尔夫球场、核查清理整治效果具有重要意义。

应用方案:

应用PaddlePaddle Faster R-CNN 模型,结合特征提取网络VGG16 及区域建议网络(Region Proposal Network,RPN)实现高尔夫球场的检测。检出准确率达到88%,相比传统方式,识别率提升90倍。

标准高尔夫球场自动检测应用方案

标准高尔夫球场自动检测应用方案

标准高尔夫球场自动检测效果图

标准高尔夫球场自动检测效果图

案例3:百度核心业务的视频理解技术

视频理解技术可以多维度解析视频内容,理解视频语义,自动分类打标签,极大节省人工审核效率,节约成本;同时精准用户推荐,提升体验效果。

应用方案:

基于PaddlePaddle 框架,采用two-stage 训练策略,涵盖2D/3D-CNN 模型,序列模等,对视频自动分类、打标签,提取视频语义向量。

基于PaddlePaddle的视频理解技术应用效果图

基于PaddlePaddle的视频理解技术应用效果图

百度Feed 流视频全流量自动分类,可全免人审,在百度搜索,百度云VCA 系统中也有应用。

案例4:百度核心业务验证的推荐解决方案

个性化推荐能力在市场上被广泛应用并在优化用户体验方面发挥着极其重要的作用。而个性化点击率预估模块是实现个性分发的重要手段。但对于拥有超大规模用户体量、海量内容库及所伴随的最高可达百亿级别用户点击日志的推荐系统,如何处理拥有自膨胀特点的海量特征数据及需要高频率迭代的模型,成为了推荐系统是否成功的核心关键。

应用方案:

PaddlePaddle 通过提供一种高性价比的多机CPU 参数服务器训练方法,可有效地解决超大规模推荐系统、超大规模数据、自膨胀的海量特征及高频率模型迭代的问题,拥有超大吞吐量及高效率。

基于PaddlePaddle的个性化推荐应用方案

基于PaddlePaddle的个性化推荐应用方案

基于真实的推荐场景的数据验证(1.4 亿总样本数中统计得到1.8 亿独立特征,平均每条样本117 个特征,单条样本平均1k 稀疏特征量),PaddlePaddle 在100 节点*10 线程/ 节点的情况下,吞吐量可达60 万~ 140 万/s,每小时可处理20 ~ 50 亿数据,且达到batch size 为512的情况下90%的加速比,已经在百度搜索、百度糯米、好看视频、百度地图、百度翻译中应用。

更多案例

• 智慧招聘——简历职位智能匹配系统

使用PaddlePaddle搭建的Gated Model(GQM),是基于CNN、DSSM、C-DSSM等算法的文本匹配模型,实现企业与求职者双方需求的高效率匹配。

• 智慧城市——楼宇设备智能管理

通过基础运行积累的大数据结合深度学习算法提高机电系统运行效率,合理设计日常保养策略,完成及时的故障预警、保养提醒,实现智能运营。

• 智慧零售——生鲜进货量智能预测

利用商超生鲜的历史销售数据,提取出多个影响销量的条件、使用DNN神经网络建立销量预测模型、使用到包括位置、时段、节假日、天气等70个维度,200+特征。

• 智慧城市——AI控烟

基于百度PaddlePaddle开源平台的深度学习能力,对数万张吸烟动作图片进行了43次深度学习模型训练,可实现对吸烟动作的识别,通过视频监控的数据从人群中识别出正在吸烟的人,将其图像提取并标注保存。

• 智慧农林——桃子分拣

智能桃子分拣机集成了图像分类模型,并利用机械完成桃子分拣自动化。有效提升桃子分类拣出的准确率及工作效率,节省大量桃农工作人力。

• 趣味生活——猜拳机

小度猜拳手通过使用深度卷积神经网络技术训练出能够识别用户出拳结果的模型,该模型可以识别石头、剪刀、布的手势。在用户出拳过程中,系统会不断采集用户的手势图片,并分析可能的出拳结果,在可信度度达到一定数值后完成对应的出拳。

• 精密零件智能质检机

使用深度学习技术,识别模型的适应性极大提升,对于不同的零件,只需要提供标注好的样本数据,即可快速完成一个新零件或者新缺陷的识别模型开发。

开发者生态

企业服务

黄埔学院——为中国产业界培养首席AI架构师 [13]

培养深度学习架构师,培育深度学习产业落地人才,打造中国深度学习核心技术圈:

• 百度深度学习T10 架构师面对面深度交流。

• 解锁百度核心业务中深度学习落地的关键Know-How。

• 剖析百度AI 生态企业中业务与深度学习结合的典型案例。

• 助力企业使用AI 思维、AI 工具、方法技术解决实际业务问题。

AI快车道—企业深度学习实战营 [14]

1000家企业深度学习技术应用支持计划,为企业提供一条AI业务转型的快车道:

• 深度学习案例应用剖析现场。

• 所学即所用的算法Code Live。

• 百度高T 的深度学习技术方案咨询。

• 直通黄埔学院的报名通道。

全天候技术支持

• 24小时GitHub技术答疑。

• 百度AI技术生态扶持。

• 优秀产业应用探索更有专家共同难点攻克。

教育生态

深度学习工程师认证

2018年,百度联合深度学习技术及应用国家工程实验室、中国软件行业协会,共同发布中国第一个深度学习工程师能力评估标准。2019年,百度向社会开放“深度学习工程师”认证考试,并提供相应的学习解决方案。 [15]

深度学习工程师认证

深度学习工程师认证

深度学习师资培训班 [16]

教育部新工科建设专项支持,百度与顶级高校联合打造精品课程,助力高校AI专业教师培养,截止2019年5月,已开办4期,共培训200+高校400名老师。

• 实践型课程设计:理论基础+高强度代码实践,教师技术水平72 小时飞跃式提升。

• 配套教学材料:包含专业教材、授课课件、配套实验、实践平台,助力教师高效开课。

• 参训教师经验交流:开课思路与教学法研讨,从输入到输出,解锁高校AI 教学新思路。

• 教育部专项基金:“协同育人” 科研基金累计发放超过200 万元,支持教师开课。

AI Studio教育版

提供教学管理与实训平台,深入促进实践型AI人才培养,已累计入驻140+高校。

• 在线教学环境:云端集成免安装,联网可用。

• 免费算力支持: CPU/GPU 资源免费提供,降低高校开课门槛。

• 内置教学实验:丰富教学实验案例,从入门到进阶,一应俱全。

• 实用教学管理:完备实用的教学管理功能,助力专业课堂教学。

深度学习在线课程 [17]

课程包含快速入门、基础知识、各领域经典模型、PaddlePaddle实战四大课程版块,涵盖Python、数学、机器学习、深度学习理论与实战等多种内容方向,满足不同水平开发者对于在线课程的多元需求。

校园赛事

1、AI 算法赛

为机器学习、深度学习、数据科学人才准备的算法挑战排名赛事。大赛面向全球开发者招募,参加比赛的选手使用PaddlePaddle挑战赛题,根据算法精度成绩排名。基于AI Studio已开办多场比赛:2018机器阅读理解技术竞赛、2018百度之星开发者大赛 [18]、无人车车道线检测挑战赛、NLP常规赛 [19]

2、产业应用赛

由企业贡献真实业务数据、业务难题,联合PaddlePaddle举办创造更优算法,并应用于业务的的赛事。

3、校园创意赛 [20]

面向全球各高校各专业的创意产品应用赛事。多为开放式赛题,要求参赛者根据不同视角,结合PaddlePaddle技术开发不同的智能应用。

出版物

百度技术学院联合深度学习技术及应用国家工程实验室、北航人工智能专家共同撰写《PaddlePaddle深度学习实战》。书中详细描述神经网络的各个细节,深入讲解算法性能优化的思路和技巧,帮助读者深入理解深度学习的精髓。

深度学习教育联盟 [21]

深度学习教育联盟为合作教育机构提供机构认证、讲师认证、课程与案例联合研发、品牌扶持等全方位的支持。已有UAI、欧若教育、景略集智等十几家企业,成为深度学习教育联盟伙伴。

1、协同育人项目

以产业和技术发展的最新需求推动高校人才培养改革,教育部组织企业支持高校共同开展产学合作协同育人项目。

2、布道师计划

现有的深度学习布道师队伍由10位深度学习专家组成,他们享有官方荣誉认证,体验百度最新深度学习各项技术,各类特色技术活动绿色通道。

国家工程实验室

2017年2月,国家发展和改革委员会正式批复,由百度牵头联合清华大学、北京航空航天大学、中国电子技术标准化研究院、中国信息通信研究院,共同筹建深度学习技术及应用国家工程实验室。PaddlePaddle依托深度学习技术与应用国家工程实验室,与国内多家科研机构及高校合作研发的深度学习技术,为深度学习研究者、企业和开发者提供功能全面的开源深度学习平台。 [22]

WAVE SUMMIT 深度学习开发者峰会

WAVE SUMMIT深度学习开发者峰会由深度学习技术及应用国家工程实验室与百度联合主办,会上,来自百度、英特尔、华为、清华大学、北京航空航天大学等公司及高校的科学家及人工智能专家共同探讨深度学习时代的技术方向及产业前景,同时,开源深度学习平台PaddlePaddle发布多项新特性及服务,为深度学习开发者提供利器。 [23]

亿元算力支持计划

2019年4月23日,在首届WAVE SUMMIT 2019深度学习开发者峰会上,百度宣布了AI Studio算力支持计划,开放价值一亿元的免费算力资源,助力开发者成功。免费算力主要以两种模式提供,第一种是一人一卡模式,V100的训练卡包括16G的显存,最高2T的存储空间。另外一种是远程集群模式,PaddlePaddle提供高性能集群,供开发者免费使用,登陆AI Studio即可使用。 [24]

声明:本网内容收集自互联网,旨在传播知识仅供参考,不代表本网赞同其观点,文字及图片版权归原网站所有。

更多精彩内容推荐:

11月份即将来临,在北京,大伙的外地车怎么弄?是开回家还是把车卖了?纠结啊?

未办理进京证在支路以上等级道路不能停放,小区内,停车场内没事。...

头条上什么时候才有收入?

首先在回答这个问题之前,我需要说明一下,做为一个在头条上有收入的人,我来回答这个问题,绝对不是在炫耀!因为,我还不够格!说句实话,我现在还只是一个普通的头条号玩家,我在悟空问答,还得坚持垂直领域的回答,我是影视领域的,现在来回答你这问题,就已经跑题了,但是我知道做自媒体的不容易,...

十二生肖中谁最有智慧?

曾经在头条写过那些生肖聪明的文章。而这个问题是那些生肖最智慧,准确的说:聪明机智与智慧不是完全同一码事,大抵智慧较聪明是更高层阶是无庸致疑的。聪明伶俐很容易被别人发现,而智慧往往是要历经周旋还才能知息智者的睿智。就象当初的大智慧者老子似的,多少年过去了,实践才证明其是真正的智慧源...

天津市的塘沽怎么样?

天津市塘沽的港口,就是天津这座城市的名片。也是这个城市的地标。塘沽区无论是在天津还是在国内的港口建设中都是非常让人瞩目的。天津市的塘沽也让所有人知晓。塘沽位于天津市的东部什天津滨海新区的中心区,总面积达859平方公里,它东面是渤海,交通非常便利。塘沽区,在2009整合了其他三个区...

泸沽湖和洱海哪个更值得去?

好纠结?...

手上有闲置资金180万左右,一直在银行购买理财产品,年利率4%左右,想问问还有没有其他投资渠道?

手上有闲置资金180万左右,一直在银行购买理财产品,年利率4%左右,想问问还有没有其他投资渠道?说实话,年利率高于4%的投资渠道简直是太多了,国债、大额存单、基金、信托、黄金以及股票等投资方式,年利率或者预期收益率都要高于4%。不过,对收益率、安全性以及流动性三者进行综合对比以后...

抛开爱国情怀,苹果与华为手机哪个比较好?

其实选手机本来也不用考虑什么爱国情怀,华为自己也很讨厌粉丝用“爱国”、“支持国货”之类的话来宣传自己,你买手机就只是纯粹因为产品好、认同品牌,抛去爱国情怀来谈华为,才是对华为最大的尊重。这里说到苹果与华为手机哪个好,其实也没什么可比性,看看两家的新品价格,苹果最便宜的iPhone...

用十块钱,你能做出四个菜吗?你会怎么做?

十块钱可以做出四个菜,不过每个菜量会少点。第一道菜番茄炒蛋番茄在菜市场买一个大一点的成本大概在5毛左右,然后再买两个鸡蛋大概成本1.5元1.回到家烧过开水然后把番茄打成十字刀放在开水烫上五分钟然后拿出去皮切块2.起锅烧油把鸡蛋打散倒入油锅炒散倒入盘中3.把锅子重新烧热一下 倒入少...

你们遇到最害羞的事是什么?真实经历的?

这题问的就让人害羞!虽然也是有过生活的人,也是经历过的事,但也难以启齿。生命中的害羞之事就属与异性接触。他是我的初恋也是我的前夫。初恋时,他是百般的对我好之余就是对我好奇,那处女的防线也绝不能打破。……我爸爸和哥哥从小就保护我,在哪里玩都有他们的出现。长大懂事妈妈就什么都告诉我。...

坐火车时看到老人买的无座票站着,周围都是读书的大学生,却没有人让座,你怎么看?

做火车时看到老人买的无座票站着,周围读书的大学生没有让座很正常,其实我们没必要道德绑架,他们让座是情分,不让座是本分。我们乘坐火车都是购买了车票的,就有权利做这个位置,任何人都没有权利道德绑架,一定要把位置让给老人,凭什么我们要让座,就因为他是老人就一定要让座吗?我们就应该让座吗...

为何有些中年女人认为自己比同龄人年轻,其实并不年轻?

倒没感觉比别人年轻,比以前的自己还要年轻!心态决定一切!...

为什么现在有的企业常年招工,一边招人,一边故意逼迫员工离职,有什么企图?

对于题目中“有的企业常年招工,一边招人,一边故意逼迫员工离职”,就我从事的行业来分析的话,我个人认为就两方面:一是企业在进行升级,也可以说是流程再造;二是一些企业在变相降低劳动成本。为什么这样说呢?一些企业发展到了一定的程度,就停滞不前,有些开始走下坡,原因就是公司老的员工跟不上...

feifeigou83cxq2007feifeigou83
猜你喜欢
热门推荐
今日推荐 更多
猜你喜欢