包阅导读总结
1.
关键词:PaddleX 3.0-beta 昇腾版、AI 开发、低代码、飞桨、模型产线
2.
总结:2023 年 12 月飞桨推出端云协同低代码开发工具 PaddleX,今年 6 月 27 日发布 PaddleX 3.0-beta 昇腾版。该版本聚焦 7 大主流 AI 场景,精选 68 个模型,构建 16 条产线,支持低门槛开发与部署,深度适配昇腾 910 芯片,未来将继续适配全部模型。
3.
主要内容:
– PaddleX 3.0-beta 昇腾版发布
– 背景:2023 年 12 月飞桨推出 PaddleX
– 特点:集成飞桨优势能力,立足产业场景,内置 12 个飞桨系列模型
– 升级:基于前后端分离架构重构,推出星河零代码产线
– PaddleX 3.0-beta 昇腾版优势
– 模型丰富场景全面:覆盖多任务场景
– 低门槛开发范式:低代码开发,支持自定义流程串联
– 昇腾硬件高效支持:深度适配昇腾 910 芯片
– 开发流程升级:统一命令,暴露关键超参数
– 模型集成方便:六行代码即可集成
– 后续计划与活动
– 未来适配全部模型
– 8 月 1 日 20:00 深度解析开发全流程,扫码预约报名,可扫码入群讨论,GitHub 点 star 支持
思维导图:
文章地址:https://mp.weixin.qq.com/s/9ewAgdfJ9ZhL9FxIFDPhnw
文章来源:mp.weixin.qq.com
作者:全栈布局的
发布时间:2024/7/30 9:54
语言:中文
总字数:1709字
预计阅读时间:7分钟
评分:85分
标签:AI开发工具,飞桨,低代码,昇腾,模型优化
以下为原文内容
本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com
2023年12月,飞桨正式推出了端云协同的低代码开发工具——PaddleX。这款一站式 AI 开发工具集成了飞桨开发套件多年积累的模型训练、推理全流程开发的优势能力。同时立足产业真实应用场景,内置12个面向产业应用的飞桨系列模型,如 PP-OCRv4、PP-ChatOCRv2、RT-DETR、PicoDet 等。基于低代码开发模式,PaddleX 不仅可以助力开发者高效实现AI应用,更成为推动企业新质生产力飞跃的利器。为了进一步提升 PaddleX 用户体验以及产品能力,飞桨基于前后端分离架构,对模型产线进行彻底重构,今年3月正式全新升级推出星河零代码产线!开发者无需代码开发经验,只需准备符合产线要求的数据集,6步即可高效体验从数据准备到模型部署的完整 AI 开发流程。
为进一步满足开发者在本地硬件设备上顺畅地开发模型,飞桨于6月27日发布 PaddleX 3.0-beta 昇腾版,该版本聚焦7大主流 AI 场景,精选68个优质飞桨模型,构建了16条产业级模型产线,包含了多项能力的显著升级,旨在助力企业开发者以低成本、零门槛的方式,有效解决产业中的实际问题。
-
模型丰富场景全面:精选 68 个优质飞桨模型,覆盖图像分类、目标检测、图像分割、OCR、文本图像版面分析、文本图像信息抽取、时序分析等任务场景。
-
低门槛开发范式,便捷开发与部署:低代码开发方式。通过统一的 API 接口实现模型产线的全流程开发,同时支持用户自定义模型流程串联。
-
昇腾硬件高效支持:携手华为团队,深度适配昇腾910芯片,覆盖 PaddleX 产线重点模型,满足用户多样化需求。
https://github.com/PaddlePaddle/PaddleX/tree/release/3.0-beta
模型开发的过程中,开发者们常常面临模型零散、选择困难等挑战。为了解决这些问题,当前 PaddleX 精选了68个优质的飞桨模型,覆盖了图像分类、目标检测、图像分割、OCR、时序预测等多个关键领域,并整合为16条模型产线。
如何低成本开发和优化单模型一直是业界关注的问题,PaddleX 为了解决这个问题,在模型的开发流程上做了升级,开发者无需深入底层原理,仅需要统一的命令,加载不同的配置,即可完成不同任务的数据校验、训练、评估、推理。在此基础上,PaddleX 暴露了关键超参数,支持开发者快速修改调参优化模型。
python main.py -c config.yaml -o Global.mode=train -o Global.device=npu:0
main.py 为模型开发统一入口,config.yaml 中包含了具体模型的信息,如模型名字、学习率、批次大小等,mode 支持数据校验(dataset_check)、训练(train)、评估(evaluate)、推理(predict)。模型训练完之后,会自动保存模型的动态图和静态图权重,方便后续集成。
python main.py -c config.yaml -o Global.mode=train -o Train.learning_rate=0.001 -o Train.epochs_iters=100 -o Global.device=npu:0
PaddleX 支持开发者对常用超参数进行快速修改进而完成模型的优化,对于模型优化的关键超参数,已经在模型对应的 config.yaml 中暴露,可以通过命令行方便地修改替换。
开发者可以方便地将训练好的模型通过六行代码,集成到自己的项目中,也可以通过这些简单的 Python API 完成模型的组合使用。
from paddlex import create_model
from paddlex import PaddleInferenceOption
kernel_option = PaddleInferenceOption()
kernel_option.set_device("npu:0")
model = create_model(model_name="PP-YOLOE_plus-S", model_dir="your_model_dir", kernel_option=kernel_option)
result = model.predict({'input_path': "xxx.jpg"})
为了满足昇腾用户的 AI 开发需求,PaddleX 团队基于飞桨框架在硬件兼容性和灵活性方面的优势,深度适配了昇腾训练芯片,提升昇腾用户的使用体验。只需要参照安装文档安装多硬件版本的飞桨框架后,在启动训练时添加一个配置设备的参数,添加一个配置设备的参数,即可在昇腾上使用上述工具。在昇腾硬件上,PaddleX 3.0-beta 支持的模型数量达到数十个,涵盖图像分类、目标检测、图像分割、时序等多个领域,详细的模型支持列表请在以下链接中查看:昇腾模型列表 。
https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta/docs/tutorials/models/support_npu_model_list.md
未来我们将继续在昇腾上适配 PaddleX 开源的全部模型,敬请期待。
为了让小伙伴们更快速地了解如何基于昇腾芯片进行模型开发全流程操作,以及基于真实产业用户场景与业务数据,如何利用本地 GPU 算力,低成本零门槛解决产业实际问题,昇腾 AI 与百度的研发工程师将于8月1日(周四)20:00为大家深度解析从数据准备、数据校验、模型训练、性能调优到模型部署的开发全流程开发难点,从场景、产线、工具完成产业实操体验。赶快扫描下方海报二维码预约报名!
同时,关于 PaddleX 的技术问题欢迎大家扫码上方二维码入群讨论,也欢迎大家在 GitHub 点 star支持我们的工作!
http://github.com/PaddlePaddle/PaddleX