-
二、Prometheus基于Alertmanager实现钉钉告警荐
Alertmanager基于Webhook集成钉钉告警
-
记一次wordpress网站迁移的经历荐
wordpress网站迁移
-
记一次因硬盘故障导致的docker服务无法启动荐
早上刚到公司,老大说,运行着gogs代码库和mariadb数据库的宿主机崩溃了(ubuntu18.04LTS)。重启电脑,默认方式启动,进入系统过程中抛出异常,信息为endKernelpanic-notsyncing:Noworkinginitfound.使用恢复模式启动,可选的启动项有6个,分别对应3个内核版本(Linux4.15.0-118,Linux4.15.0-117和Linux4.15.
-
处理一次k8s、calico无法分配podIP的心路历程荐
又一次偷偷化解了可能发生的重大事故。不想看过程的可以直接跳到末尾看处理方案。一个网络错误某天,上kplcloud构建一个测试应用,构建完成之后发现新pod一直启动失败,并且抛出了以下错误信息:Failedcreatepodsandbox:rpcerror:code=Unknowndesc=NetworkPlugincnifailedtosetuppod"xxxxxx-fc4cb949f-gpkm2
-
就这一篇,解决90% 新手连接虚拟机的网络问题荐
一、虚拟机环境准备????1、安装3台新虚拟机,对于初学者不建议克隆虚拟机。克隆虚拟机到是方便,但是总会有一些网络问题。如果虚拟机玩得明白,可以只安装1台新虚拟机,另外再克隆2台虚拟机。????2、虚拟机配置要求????????注意:????????以上配置,可以根据自己的电脑配置调整,所以我给出的是区间范围。关于操作系统,自己熟悉啥就用啥!如果不会安装linux虚拟机系统的,请参考前面的文章。传
-
删库到跑路
发布于:2020-09-28 13:29:25
4
网站日志分析最完整实践荐
splunk分析Apache日志 爬虫 robots.txt
-
三杯水
发布于:2020-09-27 15:54:00
2
使用elasticsearch-dump迁移elasticsearch集群数据荐
缘起最近某个5节点es集群发现其中1个主节点(被选中master)cpu负载很高,其中3节点master角色,所有节点默认data角色,初步操作重启这个主节点,使其角色变更减少压力,发现不起作用。后来使用Cerebro分析发现其中有个geo_infomation信息索引只有一个分片,且大小超过20G,默认单分片在SSD盘中大小最好不超过20G,HDD盘中大小最好不超过10G时性能最佳,这里分片不均
-
铁血军人
发布于:2020-09-23 15:42:16
1
prometheus-operator 监控 k8s 外部集群荐
prometheus-operator监控k8s外部集群其实监控k8s外部集群和监控内部集群没啥区别,大概思路就是把外部资源通过endpoint的方式给他虚拟成k8s集群内部的一个资源,其实下面操作就是有点为了用k8s而用k8s了,有点吃力不讨好的架势,但是我们这里为了学习,可以玩耍prometheus-operator监控etcd无论是Kubernetes集群外的还是使用Kubeadm安装在集群
-
fxl风
发布于:2020-09-10 14:50:46
0
记一次某APP后台接口并发优化案例荐
一、优化前APP故障1、业务故障现象:?APP中直播带货时,页面加载不出,APP不能正常访问。2、紧急排查:查询后台并发连接数1000左右,并不算高。查询mongodb CPU 已接近100%,查询发现存在大量慢查询日志。3、紧急处理:db.xy_contentPV.createIndex({"docid":?1},?{background:?true});添加该索引后CPU逐渐下降。4、附故障时
-
批量执行crontab指定条目的注释和解注释荐
在日常变更过程中,变更前会注释某些定时任务(比如巡检告警等),变更完成后需恢复,有时变更操作的服务器很多,对应需要注释的crontab也很多且不相同,本文通过分发平台执行对应脚本批量实现crontab的注释和解注释功能。