导读:本篇文章首席CTO笔记来给大家介绍有关devops怎么设置的相关内容,希望对大家有所帮助,一起来看看吧。
DevOps之prometheus实现优雅的告警
目前prometheus的告警,常用的有grafana自带的告警和prometheus插件alertmanger的告警两种,这里测试下alertmanger的告警功能。
综合考虑,配合上prometheus operator,使用alertmanger,能够使监控告警这块的工作更加devops。
prometheus operator 在k8s中引入了自定义资源定义(CRSs)Prometheus、ServiceMonitor、PrometheusRule和Alertmanager。
所以在k8s中搭建好prometheus operator后,当我们需要监控一个项目时,我们的配置顺序是配置ServiceMonitor获取监控数据,配置PrometheusRule获取告警阈值,配置Alertmanager制定告警发送方式
如果我们已经完成了ServerMonitor的对象的编写,下面就要将监控好的重要数据,设置阈值,触发告警。
这里用spark 服务cpu使用率为例,介绍下PrometheusRule的写法
这样我们就完成一个PrometheusRule 资源对象的编写了,那么prometheus是怎么识别这个告警规则的呢。
我们先查看下prometheus的资源对象
kubectl get prometheus/k8s -n monitoring -o yaml
可以看到,prometheus会自动匹配标签为prometheus=k8s 和 role=alert-rules的prometheusRule的资源对象,这里我们可以体会到prometheus operator自动发现的魅力,我们只需要编写相应的告警规则yaml文件,然后apply一下,便可以制定告警。
在prometheus界面上面查看刚刚制定的告警规则
对于告警通知,需要考虑以下几点
及时性:邮件通知有时候不会注意,尤其是不在电脑面前,所以这里我们选择工作中使用的企业微信作为告警消息推送方式
简洁性:如果服务器性能等到达了一个warning值,会有很多相关的告警全部触发,所以这里我们需要配置分组、静默、抑制方案
容灾性:如果alermanger或者prometheus本身挂掉了,发不出告警怎么办,一般会采用另一个监控来监控prometheus,或者自定义一个持续不断的告警通知,哪一天这个告警通知不发了,说明监控出现问题了。很棒的一点是,prometheus operator已经考虑了这一点,本身携带一个watchdog,作为对自身的监控
创建一个alertmanger配置文件
删除之前的secret对象,并且创建新的
查看企业微信,这个时候会发现已经收到告警信息
这个watchdog便是对prometheus自身的监控。如果有需要,可以制定一条路由,匹配severity为none的告警,然后每24h重复一次,这样可以达到每天监控prometheus本身的效果,哪一天没收到watchdog,便可以知道prometheus挂了。
正常收到的告警信息
alertmanger也支持webhook告警,但是比如钉钉和企业微信机器人这类对消息头有特殊要求的,如果直接用webhook的话,需要安装一个插件封装下,才可以调用
Alertmanager还支持临时静默告警。有时候我们在处理告警,想要临时静默告警消息,或者测试环境中,进行压测,需要临时静默一段时间的告警,我们就可以直接通过Alertmanager的UI临时屏蔽特定的告警通知。通过定义标签的匹配规则(字符串或者正则表达式),如果新的告警通知满足静默规则的设置,则停止向receiver发送通知
目前Alertmanager只支持在UI上面进行临时静默告警
当静默规则生效以后,从Alertmanager的Alerts页面下用户将不会看到该规则匹配到的告警信息,微信机器人也不会发送响应的告警消息
如何选择正确的DevOps工具?
DevOps工具选择需要着眼于各个阶段的需求,不同阶段时对工具的选择都是不同的,大概分为规划工具、问题跟踪工具、SCM 工具、构建工具、测试工具、持续集成和部署(CI/CD)工具、配置管理工具、云平台、容器调度程序、监控和记录工具、通讯工具等。比如构建工具,在构建阶段主要是为了保持打包的一致性,自动执行容易出错的活动,生成早期质量信号,目前业内比较常用的构建工具包括 Maven/Gradle、JFrog Artifactory、Sonatype Nexus等,JFrog Artifactory 支持多种语言,用来存储构建过程的二进制输出。
DevOps究竟是如何改变开发和运维人员的?
如今,DevOps已经被越来越多的企业认可,DevOps不仅仅停留在开发和运维的范围,如今的DevOps是软件研发全生命周期管理的一整套方法论和最佳实践,是DevOps文化建设和人才培养。如果只涉及开发和运维人员,下面从实施DevOps之前和之后做个比较。
1、强化共同目标 2、对开发人员的改变 3、对运维人员的改变
DevOps使得开发和运维人员联系更加紧密,通过建立和强化彼此的信任关系,基于DevOps自动化服务,共同实现高效,高质量,稳定的交付用户价值的目标。
我来说下,接下来2022年DevOps实践的4个关键点
1、评估流程永远都是第一步。
DevOps 其实不是一个非常好理解的概念。如果我们不能很好了解DevOps 是什么以及它对组织的意义,那将可能是一个灾难。
不仅如此,团队中的每一个人都需要同步自己对 DevOps 的了解,只有团队在充分沟通的“同意”下,DevOps 实践才能顺利。这也就是为什么所有公司在切换至 DevOps 时的难点和重点都是——文化建设和学习。
此外,对开发周期的评估也应该是全方位的、从头到尾的。开发的不同流程,有不同的瓶颈和低效率,只有找到当前流程不足的领域,才能在实施 DevOps 时锁定重点。
2、协作和目标是DevOps团队的预备动作。
在实施 DevOps之前,就应该要确定团队有没有准备好一起工作和沟通。向每一位成员灌输强烈的协作意识,并为他们提供有助于他们沟通和协作的工具。
此外,明确的目标则为DevOps 实践设立方向,否则任何DevOps实践都将毫无意义。通常,我们可以从一个更小、更容易实现的目标开始,之后再转向更大、更复杂的目标,以防止一次性改变太多带来不可修复的破坏。
3、自动化是DevOps 的重要组成部分。
在DevOps过程中,我们应该尽可能多地使用自动化手段。无论是扫描错误配置的代码还是自动化测试,现下都有各种不同的自动化工具来实现,这对效率的提升无疑是巨大的。
在这个基础上,如果还想进一步的自动化,项目就不得不考量团队是否能跟上了。所以,最好的办法是,从需要大量时间和手工的工作入手,去一步步实现自动化。采用自动化之初,也最好让团队先监控几周,看看进展如何。
4、了解关键指标是重中之重。
从实施DevOps的一开始就应该设置关键指标。如果没有指标,我们将无法跟踪进展,也无法及时发现问题。
飞算全自动开发平台项目发布的应用服务,在监控运维指标方面已集成 健康 检查、审计、统计和HTTP追踪等运维性能指标数据,所有的这些特性可以通过JMX或者HTTP endpoints来获得。
同时还可以与外部应用监控系统整合对接,可以方便地通过第三方系统进行监控告警,比如 Prometheus、 Influxdb 、Grafana等。这些系统提供了非常好的仪表盘、图标、分析和告警等功能,使用户可以通过统一的接口轻松地监控和管理应用。
devops的概念我觉得很难用一句话去定义或解释,主要是流程和工具的结合,规范的流程加上高效的工具构建符合业务和公司实际的运维场景
说到底就是把繁琐的操作自动化,在得到快速集成和快速部署的同时,减少人为引入的失误。符合自动化发展的趋势,算是自动化在软件开发运营中的成功。
DevOps是一种打通开发和运维,并将所有环节自动化,摆脱人工束缚的理念,不仅仅只是字面上的将开发和运维打通结合。
多年以来,这两个群体一直被分开,尤其是在大型企业IT组织内部。开发者只关心编码,运维人员则确保其正常运行。他们之间完全脱节,导致需要更长的QA周期。并且经常不能在环境上部署新程序,因为这样可能会导致宕机或者破坏其它程序。
DevOps实现了高标准化,仅需几个工具,就可以替代人工干预,使用有效的方式来部署、配置和运行许多的服务。
随着DevOps的诞生,开发人员可以拥有配额,在一定的范围内他们可以按照需求,实时部署环境。
运维团队不再需要关心部署单个的应用程序,他们仍然采购硬件并且配置和管理服务器,但是规模远远大于单个的应用程序,他们的责任变成了管理开发人员更容易使用的自动化DevOps服务。
如何把excel表格导入devops
1. 获取 Docker 版本并生成 csv 文件
2. 导入 CSV 到 Excel 并简单清洗数据。打开 Excel,点击最上的「文件」 - 「导入」,选择我们刚才的 CSV 文件,再选择类型 CSV 点击「导入」,导入 CSV选择分隔方式,我们选择「分隔符号」的方式:选择分隔方式,上一步我们选择使用「分隔符号」的方式导入文本,这一步选择使用什么符号,我们选择使用逗号分隔,如下,会有一个预览,我们可以看到逗号已经变成了黑色的竖线,代表列线:点击「下一步」我们开始设置列数据格式(当然也可以直接抛弃列 - 不导入此列)我这样设置:点击「预览选定数据」部分的第一列,选择列数据格式为文本,点击「预览选定数据」部分的第二列,选择不导入此列(跳过)设置列的格式或者跳过列。设置完了,点击「完成」,出现下框,点击数据导入的位置(某个格子),点击「确定」:选择位置,这样我们的数据就导入和清洗就完成了,
结语:以上就是首席CTO笔记为大家整理的关于devops怎么设置的相关内容解答汇总了,希望对您有所帮助!如果解决了您的问题欢迎分享给更多关注此问题的朋友喔~