栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 系统运维 > 运维 > Linux

开源 argo dashboard 多集群、多用户、拖拉拽、云原生调度

Linux 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

开源 argo dashboard 多集群、多用户、拖拉拽、云原生调度

全栈工程师开发手册 (作者:栾鹏)
架构系列文章


argo workflow官网 https://argoproj.github.io/argo-workflows/

使用argo server存在几个问题:

1、oa绑定到自己公司困难
2、rbac权限是k8s的,而不是web框架中定义的,没法加入自己定义的项目组
3、模板市场用户没法自行开发
4、没有拖拉拽编排界面
5、定时调度没有高级模板变量
6、无法进行多k8s集群管理调度,不好划分多项目组资源池

argo dashboard

开源地址:https://github.com/tencentmusic/argo-workflow

是由TME研发的云原生argo pipeline编排。基于argo的云原生调度,包含项目管理,在线notebook,在线镜像构建,拖拉拽编排pipeline,定时调度,实例管理。

平台完成部署之后如下:

功能简述 多集群管控

平台支持多集群调度,可以由一个web平台管控多个训练或推理集群。在不同项目组下配置当前项目组使用的集群名,然后在用户训练或部署推理时,指定对应项目组即可。

分布式存储

平台会自动为用户挂载用户个人目录,同一个用户在平台任何地方启动的容器目录下/mnt/$username均为用户个人子目录。可以将pvc/hostpath/memory/configmap等挂载成容器目录。同时可以在项目组中配置项目组的默认挂载,进而实现一个项目组共享同一个目录等功能。

在线开发

支持在线jupyterlab/theia(vscode)等功能,多用户,多实例,支持cpu/gpu版本。另外支持在线构建docker镜像,免除算法同学docker学习成本

拖拉拽pipeline编排

支持单任务调试、分布式任务日志聚合查看,pipeline调试跟踪,任务运行资源监控,以及定时调度功能(包含补录,忽略,重试,依赖,并发限制,过期淘汰等功能)

功能模板化

为了避免重复开发,对pipeline中的task功能进行模板化开发。平台开发者或用户可自行开发模板镜像,将镜像注册到平台,这样其他用户就可以复用这些功能。平台自带模板在job-template目录下

平台部署

参考install/README.md

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/882332.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号