短信登录 企业用户

未注册过的手机号登录即创建广告门账号

综合

综合

案例

公司

专题

AI NIKE 肯德基 金瞳奖 华为 刘亦菲 蒙牛 脱口秀 中秋 双十一 双11 趋势 麦当劳 财报 教师节
清除历史

发布时间:2025-10-17 14:17

10-20K

运维工程师

深圳市 3-5年 本科

弹性工作 带薪年假 五险一金

立即投递

分享

广告门严禁用人单位做出任何损害求职者合法权益的违法违规行为,包括但不限于:扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报

职位描述

岗位职责:

1. 负责公司 AI Agent 产品及配套平台系统的部署、发布与环境管理,支持模型服务、高并发业务接口与内部平台的持续稳定运行;

2. 搭建并优化 CI/CD 流程,覆盖开发、预发、生产环境,支持代码回滚、模型灰度发布、快速热更新;

3. 维护大语言模型推理服务运行环境(如 LLM 微调/推理框架、GPU 服务容器、显存调度等),确保响应时延与高可用;

4. 构建完善的监控与告警体系(如 Prometheus + Grafana/ELK),覆盖模型加载失败、插件链路异常、服务降级等关键指标;

5. 与算法工程师协作,完成模型上线流程自动化、推理服务容器部署、A/B实验隔离等能力建设;

6. 管理云平台与成本预算,评估GPU资源利用率、磁盘IO、网络性能等系统瓶颈,提升系统稳定性与性价比;

7. 参与服务SLA定义、稳定性目标设定与恢复策略设计,推动运维能力产品化,赋能全栈团队高效交付。


任职要求:

1. 具备 3 年以上互联网平台或分布式系统运维经验,熟悉 Linux 操作系统、Shell 编程及基础网络;

2. 熟练掌握 Docker / Kubernetes 等容器技术,了解微服务架构下的多模块部署、资源隔离与服务发现;

3. 熟悉 GitLab CI、Jenkins 等 CI/CD 工具链,具备流水线编排、权限管理、自动化测试接入等经验;

4. 熟悉 Prometheus / Grafana / ELK 等监控日志工具,具备报警规则编写、SLO/SLA 监测经验;

5. 有 AI/LLM 模型部署经验(如推理框架服务容器优化)者优先;

6. 对智能产品的运行机制具备系统化认知,关注用户请求链路、Agent行为输出稳定性,具备跨后端/算法/产品协作意识;

7. 具备风险预判、流程规范意识,能独立处理服务故障、设计应急机制,并能沉淀为团队规范或运维工具。

公司信息

云智科技

全案服务 | 广告创意 | 数字营销
全部职位

公司地址

  • 广东省广州市天河区广州天河区高德置地广场写字楼G座2901
关闭

意见反馈/举报

反馈/举报信息:

联系方式(选填):