系统监控与告警处理 协助正式员工对应用系统进行 7*24 小时实时监控,密切关注系统运行状态,及时发现性能瓶颈、服务中断等异常情况。 参与制定并执行告警规则,当系统触发告警时,迅速响应,依据既定流程初步排查问题根源,并及时向相关负责人汇报。 协助维护监控系统,保障其数据准确性与稳定性,定期整理告警数据,为优化监控策略提供依据。 应用部署与升级支持 在资深工程师指导下,参与应用系统的部署与升级工作,熟悉部署流程与工具(如 Ansible、Kubernetes 等)。 负责基础环境配置,包括服务器操作系统安装、网络参数设置、中间件部署等,并进行简单的功能测试,确保部署环境符合要求。 协助记录部署与升级过程中的关键信息,如操作步骤、遇到的问题及解决方案,为后续运维工作提供参考。 运维数据收集与分析 协助收集系统运行数据,如 CPU 使用率、内存占用、网络流量、用户请求量等,运用工具(如 Excel、SQL 等)进行数据整理与初步分析。 通过数据可视化手段(如使用 Python 的 Matplotlib 库),制作直观的数据报表与图表,展示系统性能趋势,为运维决策提供数据支持。 配合团队对数据
学历与专业:本科及以上学历的在校学生,计算机科学与技术、软件工程、网络工程等相关专业优先考虑。 技术技能: 熟悉 Linux 操作系统,掌握常用命令,如文件管理、进程管理、网络配置等,能够进行简单的系统操作与故障排查。 了解数据库基础知识,掌握 SQL 语法,能够进行简单的数据库查询、数据更新等操作。 具备一定的编程语言基础,如 Python、Java、Go 等,能够读懂代码逻辑,尝试编写简单的脚本解决实际问题。 对网络基础知识有一定了解,熟悉 TCP/IP 协议栈,能够理解网络拓扑结构与常见网络故障排查方法。 能力素质: 具备较强的学习能力与好奇心,对应用运维领域有浓厚兴趣,能够主动学习新知识、新技能,快速适应不断变化的技术环境。 良好的沟通能力与团队协作精神,能够与不同专业背景的人员进行有效的沟通交流,积极参与团队协作项目,共同解决问题。 工作认真负责、细致严谨,具备较强的责任心与服务意识,对待用户反馈与运维任务能够及时响应、高效处理。 较强的问题解决能力与逻辑思维能力,面对复杂的技术问题能够进行有条理的分析,提出合理的解决方案。