Tips
Go
(18条消息) Go语言自学系列 | golang包_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang并发编程之channel的遍历_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang并发编程之select switch_COCOgsta的博客-CSDN博客_golang select switch
(18条消息) Go语言自学系列 | golang并发编程之runtime包_COCOgsta的博客-CSDN博客_golang runtime包
(18条消息) Go语言自学系列 | golang接口值类型接收者和指针类型接收者_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang并发编程之Timer_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang方法_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang并发编程之WaitGroup实现同步_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang构造函数_COCOgsta的博客-CSDN博客_golang 构造函数
(18条消息) Go语言自学系列 | golang方法接收者类型_COCOgsta的博客-CSDN博客_golang 方法接收者
(18条消息) Go语言自学系列 | golang接口_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang接口和类型的关系_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang结构体_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang结构体_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang标准库os模块 - File文件读操作_COCOgsta的博客-CSDN博客_golang os.file
(18条消息) Go语言自学系列 | golang继承_COCOgsta的博客-CSDN博客_golang 继承
(18条消息) Go语言自学系列 | golang嵌套结构体_COCOgsta的博客-CSDN博客_golang 结构体嵌套
(18条消息) Go语言自学系列 | golang并发编程之Mutex互斥锁实现同步_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang并发变成之通道channel_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang并发编程之原子操作详解_COCOgsta的博客-CSDN博客_golang 原子操作
(18条消息) Go语言自学系列 | golang并发编程之原子变量的引入_COCOgsta的博客-CSDN博客_go 原子变量
(18条消息) Go语言自学系列 | golang并发编程之协程_COCOgsta的博客-CSDN博客_golang 协程 并发
(18条消息) Go语言自学系列 | golang接口嵌套_COCOgsta的博客-CSDN博客_golang 接口嵌套
(18条消息) Go语言自学系列 | golang包管理工具go module_COCOgsta的博客-CSDN博客_golang 包管理器
(18条消息) Go语言自学系列 | golang标准库os模块 - File文件写操作_COCOgsta的博客-CSDN博客_go os模块
(18条消息) Go语言自学系列 | golang结构体的初始化_COCOgsta的博客-CSDN博客_golang 结构体初始化
(18条消息) Go语言自学系列 | golang通过接口实现OCP设计原则_COCOgsta的博客-CSDN博客
(18条消息) Go语言自学系列 | golang标准库os包进程相关操作_COCOgsta的博客-CSDN博客_golang os包
(18条消息) Go语言自学系列 | golang标准库ioutil包_COCOgsta的博客-CSDN博客_golang ioutil
(18条消息) Go语言自学系列 | golang标准库os模块 - 文件目录相关_COCOgsta的博客-CSDN博客_go语言os库
Golang技术栈,Golang文章、教程、视频分享!
(18条消息) Go语言自学系列 | golang结构体指针_COCOgsta的博客-CSDN博客_golang 结构体指针
Ansible
太厉害了,终于有人能把Ansible讲的明明白白了,建议收藏_互联网老辛
ansible.cfg配置详解
Docker
Docker部署
linux安装docker和Docker Compose
linux 安装 docker
Docker中安装Docker遇到的问题处理
Docker常用命令
docker常用命令小结
docker 彻底卸载
Docker pull 时报错:Get https://registry-1.docker.io/v2/library/mysql: net/http: TLS handshake timeout
Docker 拉镜像无法访问 registry-x.docker.io 问题(Centos7)
docker 容器内没有权限
Linux中关闭selinux的方法是什么?
docker run 生成 docker-compose
Docker覆盖网络部署
docker pull后台拉取镜像
docker hub
Redis
Redis 集群别乱搭,这才是正确的姿势
linux_离线_redis安装
怎么实现Redis的高可用?(主从、哨兵、集群) - 雨点的名字 - 博客园
redis集群离线安装
always-show-logo yes
Redis集群搭建及原理
[ERR] Node 172.168.63.202:7001 is not empty. Either the nodealready knows other nodes (check with CLUSTER NODES) or contains some - 亲爱的不二999 - 博客园
Redis daemonize介绍
redis 下载地址
Redis的redis.conf配置注释详解(三) - 云+社区 - 腾讯云
Redis的redis.conf配置注释详解(一) - 云+社区 - 腾讯云
Redis的redis.conf配置注释详解(二) - 云+社区 - 腾讯云
Redis的redis.conf配置注释详解(四) - 云+社区 - 腾讯云
Linux
在终端连接ssh的断开关闭退出的方法
漏洞扫描 - 灰信网(软件开发博客聚合)
find 命令的参数详解
vim 编辑器搜索功能
非root安装rpm时,mockbuild does not exist
Using a SSH password instead of a key is not possible because Host Key checking
(9条消息) 安全扫描5353端口mDNS服务漏洞问题_NamiJava的博客-CSDN博客_5353端口
Linux中使用rpm命令安装rpm包
ssh-copy-id非22端口的使用方法
How To Resolve SSH Weak Key Exchange Algorithms on CentOS7 or RHEL7 - infotechys.com
Linux cp 命令
yum 下载全量依赖 rpm 包及离线安装(终极解决方案) - 叨叨软件测试 - 博客园
How To Resolve SSH Weak Key Exchange Algorithms on CentOS7 or RHEL7 - infotechys.com
RPM zlib 下载地址
运维架构网站
欢迎来到 Jinja2
/usr/local/bin/ss-server -uv -c /etc/shadowsocks-libev/config.json -f /var/run/s
ruby 安装Openssl 默认安装位置
Linux 常用命令学习 | 菜鸟教程
linux 重命名文件和文件夹
linux命令快速指南
ipvsadm
Linux 下查找日志中的关键字
Linux 切割大 log 日志
CentOS7 关于网络的设置
rsync 命令_Linux rsync 命令用法详解:远程数据同步工具
linux 可视化界面安装
[问题已处理]-执行yum卡住无响应
GCC/G++升级高版本
ELK
Docker部署ELK
ELK+kafka+filebeat+Prometheus+Grafana - SegmentFault 思否
(9条消息) Elasticsearch设置账号密码_huas_xq的博客-CSDN博客_elasticsearch设置密码
Elasticsearch 7.X 性能优化
Elasticsearch-滚动更新
Elasticsearch 的内存优化_大数据系统
Elasticsearch之yml配置文件
ES 索引为Yellow状态
Logstash:Grok filter 入门
logstash grok 多项匹配
Mysql
Mysql相关Tip
基于ShardingJDBC实现数据库读写分离 - 墨天轮
MySQL-MHA高可用方案
京东三面:我要查询千万级数据量的表,怎么操作?
OpenStack
(16条消息) openstack项目中遇到的各种问题总结 其二(云主机迁移、ceph及扩展分区)_weixin_34104341的博客-CSDN博客
OpenStack组件介绍
百度大佬OpenStack流程
openstack各组件介绍
OpenStack生产实际问题总结(一)
OpenStack Train版离线部署
使用Packstack搭建OpenStack
K8S
K8S部署
K8S 集群部署
kubeadm 重新 init 和 join-pudn.com
Kubernetes 实战总结 - 阿里云 ECS 自建 K8S 集群 Kubernetes 实战总结 - 自定义 Prometheus
【K8S实战系列-清理篇1】k8s docker 删除没用的资源
Flannel Pod Bug汇总
Java
Jdk 部署
JDK部署
java线程池ThreadPoolExecutor类使用详解 - bigfan - 博客园
ShardingJDBC实现多数据库节点分库分表 - 墨天轮
Maven Repository: Search/Browse/Explore
其他
Git在阿里,我们如何管理代码分支?
chrome F12调试网页出现Paused in debugger
体验IntelliJ IDEA的远程开发(Remote Development) - 掘金
Idea远程调试
PDF转MD
强哥分享干货
优秀开源项目集合
vercel 配合Github 搭建项目Doc门户
如何用 Github Issues 写技术博客?
Idea 2021.3 Maven 3.8.1 报错 Blocked mirror for repositories 解决
列出maven依赖
[2022-09 持续更新] 谷歌 google 镜像 / Sci-Hub 可用网址 / Github 镜像可用网址总结
阿里云ECS迁移
linux访问github
一文教你使用 Docker 启动并安装 Nacos-腾讯云开发者社区-腾讯云
Nginx
Nginx 部署
Nginx 部署安装
Nginx反向代理cookie丢失的问题_longzhoufeng的博客-CSDN博客_nginx 代理后cookie丢失
Linux 系统 Https 证书生成与Nginx配置 https
数据仓库
实时数仓
松果出行 x StarRocks:实时数仓新范式的实践之路
实时数据仓库的一些分层和分层需要处理的事情,以及数据流向
湖仓一体电商项目
湖仓一体电商项目(一):项目背景和架构介绍
湖仓一体电商项目(二):项目使用技术及版本和基础环境准备
湖仓一体电商项目(三):3万字带你从头开始搭建12个大数据项目基础组件
数仓笔记
数仓学习总结
数仓常用平台和框架
数仓学习笔记
数仓技术选型
尚硅谷教程
尚硅谷学习笔记
尚硅谷所有已知的课件资料
尚硅谷大数据项目之尚品汇(11数据质量管理V4.0)
尚硅谷大数据项目之尚品汇(10元数据管理AtlasV4.0)
尚硅谷大数据项目之尚品汇(9权限管理RangerV4.0)
尚硅谷大数据项目之尚品汇(8安全环境实战V4.0)
尚硅谷大数据项目之尚品汇(7用户认证KerberosV4.1)
尚硅谷大数据项目之尚品汇(6集群监控ZabbixV4.1)
尚硅谷大数据项目之尚品汇(5即席查询PrestoKylinV4.0)
尚硅谷大数据项目之尚品汇(4可视化报表SupersetV4.0)
尚硅谷大数据项目之尚品汇(3数据仓库系统)V4.2.0
尚硅谷大数据项目之尚品汇(2业务数据采集平台)V4.1.0
尚硅谷大数据项目之尚品汇(1用户行为采集平台)V4.1.0
数仓治理
数据中台 元数据规范
数据中台的那些 “经验与陷阱”
2万字详解数据仓库数据指标数据治理体系建设方法论
数据仓库,为什么需要分层建设和管理? | 人人都是产品经理
网易数帆数据治理演进
数仓技术
一文看懂大数据生态圈完整知识体系
阿里云—升舱 - 数据仓库升级白皮书
最全企业级数仓建设迭代版(4W字建议收藏)
基于Hue,Dolphinscheduler,HIVE分析数据仓库层级实现及项目需求案例实践分析
详解数据仓库分层架构
数据仓库技术细节
大数据平台组件介绍
总览 2016-2021 年全球机器学习、人工智能和大数据行业技术地图
Apache DolphinScheduler 3.0.0 正式版发布!
数据仓库面试题——介绍下数据仓库
数据仓库为什么要分层,各层的作用是什么
Databend v0.8 发布,基于 Rust 开发的现代化云数据仓库 - OSCHINA - 中文开源技术交流社区
数据中台
数据中台设计
大数据同步工具之 FlinkCDC/Canal/Debezium 对比
有数数据开发平台文档
Shell
Linux Shell 命令参数
shell 脚本编程
一篇教会你写 90% 的 Shell 脚本
Kibana
Kibana 查询语言(KQL)
Kibana:在 Kibana 中的四种表格制作方式
Kafka
Kafka部署
canal 动态监控 Mysql,将 binlog 日志解析后,把采集到的数据发送到 Kafka
OpenApi
OpenAPI 标准规范,了解一下?
OpenApi学术论文
贵阳市政府数据开放平台设计与实现
OpenAPI简介
开放平台:运营模式与技术架构研究综述
管理
技术部门Leader是不是一定要技术大牛担任?
华为管理体系流程介绍
DevOps
*Ops
XOps 已经成为一个流行的术语 - 它是什么?
Practical Linux DevOps
Jenkins 2.x实践指南 (翟志军)
Jenkins 2权威指南 ((美)布伦特·莱斯特(Brent Laster)
DevOps组件高可用的思路
KeepAlived
VIP + KEEPALIVED + LVS 遇到Connection Peer的问题的解决
MinIO
MinIO部署
Minio 分布式集群搭建部署
Minio 入门系列【16】Minio 分片上传文件 putObject 接口流程源码分析
MinioAPI 浅入及问题
部署 minio 兼容 aws S3 模式
超详细分布式对象存储 MinIO 实战教程
Hadoop
Hadoop 部署
Hadoop集群部署
windows 搭建 hadoop 环境(解决 HADOOP_HOME and hadoop.home.dir are unset
Hadoop 集群搭建和简单应用(参考下文)
Hadoop 启动 NameNode 报错 ERROR: Cannot set priority of namenode process 2639
jps 命令查看 DataNode 进程不见了 (hadoop3.0 亲测可用)
hadoop 报错: Operation category READ is not supported in state standby
Spark
Spark 部署
Spark 集群部署
spark 心跳超时分析 Cannot receive any reply in 120 seconds
Spark学习笔记
apache spark - Failed to find data source: parquet, when building with sbt assembly
Spark Thrift Server 架构和原理介绍
InLong
InLong 部署
Apache InLong部署文档
安装部署 - Docker 部署 - 《Apache InLong v1.2 中文文档》 - 书栈网 · BookStack
基于 Apache Flink SQL 的 InLong Sort ETL 方案解析
关于 Apache Pulsar 在 Apache InLong 接入数据
zookeeper
zookeeper 部署
使用 Docker 搭建 Zookeeper 集群
美团技术团队
StarRocks
StarRocks技术白皮书(在线版)
JuiceFS
AI 场景存储优化:云知声超算平台基于 JuiceFS 的存储实践
JuiceFS 在 Elasticsearch/ClickHouse 温冷数据存储中的实践
JuiceFS format
元数据备份和恢复 | JuiceFS Document Center
JuiceFS 元数据引擎选型指南
Apache Hudi 使用文件聚类功能 (Clustering) 解决小文件过多的问题
普罗米修斯
k8s 之 Prometheus(普罗米修斯)监控,简单梳理下 K8S 监控流程
k8s 部署 - 使用helm3部署监控prometheus(普罗米修斯),从零到有,一文搞定
k8s 部署 - 使用 helm3 部署监控 prometheus(普罗米修斯),从零到有,一文搞定
k8s 部署 - 如何完善 k8s 中 Prometheus(普罗米修斯)监控项目呢?
k8s 部署 - k8s 中 Prometheus(普罗米修斯)的大屏展示 Grafana + 监控报警
zabbix
一文带你掌握 Zabbix 监控系统
Stream Collectors
Nvidia
Nvidia API
CUDA Nvidia驱动安装
NVIDIA驱动失效简单解决方案:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.
ubuntu 20 CUDA12.1安装流程
nvidia开启持久化模式
nvidia-smi 开启持久化
Harbor
Harbor部署文档
Docker 爆出 it doesn't contain any IP SANs
pandoc
其他知识
大模型
COS 597G (Fall 2022): Understanding Large Language Models
如何优雅的使用各类LLM
ChatGLM3在线搜索功能升级
当ChatGLM3能用搜索引擎时
OCR神器,PDF、数学公式都能转
Stable Diffusion 动画animatediff-cli-prompt-travel
基于ERNIE Bot自定义虚拟数字人生成
pika负面提示词
开通GPT4的方式
GPT4网站
低价开通GPT Plus
大模型应用场景分享
AppAgent AutoGPT变体
机器学习
最大似然估计
权衡偏差(Bias)和方差(Variance)以最小化均方误差(Mean Squared Error, MSE)
伯努利分布
方差计算公式
均值的高斯分布估计
没有免费午餐定理
贝叶斯误差
非参数模型
最近邻回归
表示容量
最优容量
权重衰减
正则化项
Sora
Sora官方提示词
看完32篇论文,你大概就知道Sora如何炼成? |【经纬低调出品】
Sora论文
Sora 物理悖谬的几何解释
Sora 技术栈讨论
RAG垂直落地
DB-GPT与TeleChat-7B搭建相关RAG知识库
ChatWithRTX
ChatRTX安装教程
ChatWithRTX 踩坑记录
ChatWithRTX 使用其他量化模型
ChatWithRTX介绍
RAG 相关资料
英伟达—大模型结合 RAG 构建客服场景自动问答
又一大模型技术开源!有道自研RAG引擎QAnything正式开放下载
收藏!RAG入门参考资料开源大总结:RAG综述、介绍、比较、预处理、RAG Embedding等
RAG调研
解决现代RAG实际生产问题
解决现代 RAG 系统中的生产问题-II
Modular RAG and RAG Flow: Part Ⅰ
Modular RAG and RAG Flow: Part II
先进的Retriever技术来增强你的RAGs
高级RAG — 使用假设文档嵌入 (HyDE) 改进检索
提升 RAG:选择最佳嵌入和 Reranker 模型
LangGraph
增强型RAG:re-rank
LightRAG:使用 PyTorch 为 LLM 应用程序提供支持
RAG 101:分块策略
模型训练
GPU相关资料
[教程] conda安装简明教程(基于miniconda和Windows)
PyTorch CUDA对应版本 | PyTorch
资料
李一舟课程全集
零碎资料
苹果各服共享ID
数据中心网络技术概览
华为大模型训练学习笔记
百度AIGC工程师认证考试答案(可换取工信部证书)
百度智能云生成式AI认证工程师 考试和证书查询指南
深入理解 Megatron-LM(1)基础知识
QAnything
接入QAnything的AI问答知识库,可私有化部署的企业级WIKI知识库
wsl --update失效Error code: Wsl/UpdatePackage/0x80240438的解决办法
Docker Desktop 启动docker engine一直转圈解决方法
win10开启了hyper-v,docker 启动还是报错 docker desktop windows hypervisor is not present
WSL虚拟磁盘过大,ext4迁移 Windows 中创建软链接和硬链接
WSL2切换默认的Linux子系统
Windows的WSL子系统,自动开启sshd服务
新版docker desktop设置wsl(使用windown的子系统)
WSL 开启ssh
Windows安装网易开源QAnything打造智能客服系统
芯片
国内互联网大厂自研芯片梳理
超算平台—算力供应商
Linux 磁盘扩容
Linux使用growpart工具进行磁盘热扩容(非LVM扩容方式)
关于centos7 扩容提示no tools available to resize disk with 'gpt' - o夜雨随风o - 博客园
(小插曲)neo4j配置apoc插件后检查版本发现:Unknown function ‘apoc.version‘ “EXPLAIN RETURN apoc.version()“
vfio-pci与igb_uio映射硬件资源到DPDK的流程分析
KubeVirt
vnc server配置、启动、重启与连接 - 王约翰 - 博客园
虚拟机Bug解决方案
kubevirt 如何通过CDI上传镜像文件
在 K8S 上也能跑 VM!KubeVirt 簡介與建立(部署篇) | Cloud Solutions
KubeVirt 04:容器化数据导入 – 小菜园
Python
安装 flash_attn
手把手教你在linux上安装pytorch与cuda
AI
在启智社区基于PyTorch运行国产算力卡的模型训练实验
Scaling law
免费的GPT3.5 API
AI Engineer Roadmap & Resources 🤖
模型排行
edk2
K8S删除Evicted状态的pod
docker 中启动 docker
远程本地多用户桌面1.17(一种不让电脑跟你抢键鼠的思路) - 哔哩哔哩
华为鲲鹏服务器(ARM架构)部署Prometheus
在Linux上安装配置Grafana_AI开发平台ModelArts_华为云
abrt-ccpp干崩服务器查询记录
kubevirt 中文社区
VNCServer 连接方法
Pod创建流程代码版本[kubelet篇]
[译]深入剖析 Kubernetes MutatingAdmissionWebhook-腾讯云开发者社区-腾讯云
[译]深入剖析 Kubernetes MutatingAdmissionWebhook-腾讯云开发者社区-腾讯云
深入理解 Kubernetes Admission Webhook-阳明的博客
CentOS7 安装 mbedtls和mbedtls-devel
docker in docker 启动命令
go 协程泄漏 pprof
-
+
首页
一文带你掌握 Zabbix 监控系统
> 本文由 [简悦 SimpRead](http://ksria.com/simpread/) 转码, 原文地址 [mp.weixin.qq.com](https://mp.weixin.qq.com/s/MKhpwbCS_cthqbj_PAFOUA) 作者:惨绿少年 原文链接:https://cloud.tencent.com/developer/article/1008057 一、监控概述 ------ ### 1.1 为什么要监控 在需要的时刻,提前提醒我们服务器出问题了 当出问题之后,可以找到问题的根源 网站 / 服务器 的可用性 #### 1.1.1 网站可用性 在软件系统的高可靠性(也称为可用性,英文描述为 HA,High Available)里有个衡量其可靠性的标准——X 个 9,这个 X 是代表数字 3~5。X 个 9 表示在软件系统 1 年时间的使用过程中,系统可以正常使用时间与总时间(1 年)之比,我们通过下面的计算来感受下 X 个 9 在不同级别的可靠性差异。 > 1 个 9:(1-90%)_365=36.5 天,表示该软件系统在连续运行 1 年时间里最多可能的业务中断时间是 36.5 天 > 2 个 9:(1-99%)_365=3.65 天 ,表示该软件系统在连续运行 1 年时间里最多可能的业务中断时间是 3.65 天 > 3 个 9:(1-99.9%)_365_24=8.76 小时,表示该软件系统在连续运行 1 年时间里最多可能的业务中断时间是 8.76 小时。 > 4 个 9:(1-99.99%)_365_24=0.876 小时 = 52.6 分钟,表示该软件系统在连续运行 1 年时间里最多可能的业务中断时间是 52.6 分钟。 > 5 个 9:(1-99.999%)_365_24_60=5.26 分钟,表示该软件系统在连续运行 1 年时间里最多可能的业务中断时间是 5.26 分钟。 > 6 个 9:(1-99.9999%)_365_24_60*60=31 秒, 示该软件系统在连续运行 1 年时间里最多可能的业务中断时间是 31 秒 ### 1.2 监控什么东西 监控一切需要监控的东西,只要能够想到,能够用命令实现的都能用来监控 #### 1.2.1 监控范畴 ![](http://kmgy.top:9000/image/2022/10/30/640) #### 1.3.1 远程管理服务器 如果想远程管理服务器就有远程管理卡,比如 Dell idRAC,HP ILO,IBM IMM #### 1.3.2 监控硬件 二、安装 Zabbix ----------- ### 2.1 环境检查 ![](http://kmgy.top:9000/image/2022/10/30/202210301407305.jpeg) #### 2.2.1 安装方式选择 * 编译安装 (服务较多,环境复杂) * yum 安装(干净环境) * 使用 yum 需要镜像 yum 源 http://www.cnblogs.com/clsn/p/7866643.html #### 2.2.2 服务端快速安装脚本 ![](http://kmgy.top:9000/image/2022/10/30/202210301407712.jpeg) ![](http://kmgy.top:9000/image/2022/10/30/202210301408251.jpeg) #### 2.2.3 客户端快速部署脚本 ![](http://kmgy.top:9000/image/2022/10/30/202210301408031.png) ### 2.3 检测连通性 #### 2.3.1 服务端安装 zabbix-get 检测工具 ``` [root@m01 ~]# zabbix_get -s 172.16.1.51 -p 10050 -k "net.tcp.port[,3306]"1 #检查是否能建立 TCP 连接到指定端口。返回 0 - 不能连接;1 - 可以连接 ``` ![](http://kmgy.top:9000/image/2022/10/30/202210301408880.png) 三、Web 界面操作 ---------- ### 3.1 zabbix 的 web 安装 #### 3.1.1 使用浏览器访问 http://10.0.0.61/zabbix/setup.php ![](http://kmgy.top:9000/image/2022/10/30/202210301408232.png) 在检测信息时,可查看具体的报错信息进行不同的解决 ![](http://kmgy.top:9000/image/2022/10/30/202210301408927.png) 选择 mysql 数据库,输入密码即可 ![](http://kmgy.top:9000/image/2022/10/30/202210301408445.png) host 与 port 不需要修改,name 自定义 ![](http://kmgy.top:9000/image/2022/10/30/202210301409994.png) 确认信息, 正确点击下一步 ![](http://kmgy.top:9000/image/2022/10/30/202210301409499.png) 安装完成、点击 finsh ![](http://kmgy.top:9000/image/2022/10/30/202210301409611.png) 进入登陆界面 账号 Admin 密码 zabbix 注意 A 大写 ![](http://kmgy.top:9000/image/2022/10/30/202210301409404.png) ### 3.2 添加监控信息 #### 3.2.1 修改监控管理机 zabbix server 配置 >> 主机 ![](http://kmgy.top:9000/image/2022/10/30/202210301409538.png) 主机名称:要与主机名相同,这是 zabbix server 程序用的 可见名称:显示在 zabbix 网页上的,给我们看的 ![](http://kmgy.top:9000/image/2022/10/30/202210301409387.jpeg) 修改后,要将下面的已启用要勾上 ![](http://kmgy.top:9000/image/2022/10/30/202210301409423.png) 添加完成就有了管理机的监控主机 ![](http://kmgy.top:9000/image/2022/10/30/202210301409561.jpeg) #### 3.2.2 添加新的主机 配置 >> 主机 >> 创建主机 ![](http://kmgy.top:9000/image/2022/10/30/202210301409040.png) 注意勾选以启用 ![](http://kmgy.top:9000/image/2022/10/30/202210301409238.png) 然后添加模板,选择 linux OS ,先点小添加,再点大添加。 ![](http://kmgy.top:9000/image/2022/10/30/202210301410089.png) 添加完成,将会又两条监控主机信息 ![](http://kmgy.top:9000/image/2022/10/30/202210301410174.jpeg) #### 3.2.3 查看监控内容 检测中 >> 最新数据 在最新数据中需要筛选, ![](http://kmgy.top:9000/image/2022/10/30/202210301410212.jpeg) 输入 ip 或者名字都能够搜索出来 ![](http://kmgy.top:9000/image/2022/10/30/202210301410519.png) 在下面就会列出所有的监控项 ![](http://kmgy.top:9000/image/2022/10/30/202210301410301.png) [Docker+K8s+Jenkins 主流技术全解视频资料【干货免费分享】](http://mp.weixin.qq.com/s?__biz=MzAwNTM5Njk3Mw==&mid=2247506725&idx=2&sn=cb0395b93925ce3a06edf60d7ca7d2c1&chksm=9b1fdba7ac6852b182a5907c301fc9df85497315989ee99c4fbc2a88fad84a6032783b3524b0&scene=21#wechat_redirect) #### 3.2.4 查看图像 ![](http://kmgy.top:9000/image/2022/10/30/202210301410214.jpeg) 检测中 >> 图形 选择正确的主机。选择要查看的图形即可出图 ![](http://kmgy.top:9000/image/2022/10/30/202210301410214.jpeg) 四、自定义监控与监控报警 ------------ ### 4.1 自定义监控 #### 4.1.1 说明 zabbix 自带模板 Template OS Linux (Template App Zabbix Agent) 提供 CPU、内存、磁盘、网卡等常规监控,只要新加主机关联此模板,就可自动添加这些监控项。 需求:服务器登陆人数不能超过三人,超过三人报警 #### 4.1.2 预备知识 ![](http://kmgy.top:9000/image/2022/10/30/202210301410516.png) ### 4.2 实现自定义监控 #### 4.2.1 自定义语法 ![](http://kmgy.top:9000/image/2022/10/30/202210301411118.png) #### 4.2.2 agent 注册 ![](http://kmgy.top:9000/image/2022/10/30/202210301411310.png) #### 4.2.3 在 server 端注册 (web 操作) ① 创建模板 配置 >> 模板 >> 创建模板 ![](http://kmgy.top:9000/image/2022/10/30/202210301411583.jpeg) 点击添加,即可创建出来模板 ![](http://kmgy.top:9000/image/2022/10/30/202210301411521.png) 查看创建出来的模板。 ② 创建应用集 应用集类似 (目录 / 文件夹),其作用是给监控项分类。 点击 应用集 >> 创建应用集 ![](http://kmgy.top:9000/image/2022/10/30/202210301411473.png) 自定义应用集的名称,然后点击添加 ③ 创建监控项 监控项 >> 创建监控项 ![](http://kmgy.top:9000/image/2022/10/30/202210301411086.png) 键值 — key, 即前面出创建的 login-user。 ![](http://kmgy.top:9000/image/2022/10/30/202210301411397.jpeg) 注意:创建监控项的时候,注意选择上应用集,即之前创建的安全。 ![](http://kmgy.top:9000/image/2022/10/30/202210301411402.jpeg) ④创建触发器 触发器的作用:当监控项获取到的值达到一定条件时就触发报警 (根据需求创建) 触发器 >> 创建触发器 创建触发器,自定义名称,该名称是报警时显示的名称。 表达式,点击右边的添加,选择表达式。 严重性自定义。 ![](http://kmgy.top:9000/image/2022/10/30/202210301411016.jpeg) 表达式的定义 ↓ ,选择之前创建的监控项, 最新的 T 值为当前获取到的值。 ![](http://kmgy.top:9000/image/2022/10/30/202210301411137.png) 添加完成,能够在触发器中看到添加的情况 ![](http://kmgy.top:9000/image/2022/10/30/202210301411498.png) ⑤创建图形 以图形的方式展示出来监控信息 图形 >> 创建图形 名称自定义,关联上监控项。 ![](http://kmgy.top:9000/image/2022/10/30/202210301412397.jpeg) ⑥主机关联模板 配置 >> 主机 一个主机可以关联多个模板 ![](http://kmgy.top:9000/image/2022/10/30/202210301412870.png) #### 4.2.4 查看监控的图形 ![](http://kmgy.top:9000/image/2022/10/30/202210301412171.jpeg) ### 4.3 监控报警 #### 4.3.1 第三方报警平台 http://www.onealert.com 通过 OneAlert 提供的通知分派与排班策略,以及全方位的短信、微信、QQ、电话提醒服务,您可以在最合适的时间,将最重要的信息推送给最合适的人员。 #### 4.3.2 onealert 配置 添加应用,注意添加的是 zabbix ![](http://kmgy.top:9000/image/2022/10/30/202210301412715.jpeg) 实现微信报警需要关注微信公众号即可。 ![](http://kmgy.top:9000/image/2022/10/30/202210301412738.png) #### 4.3.3 安装 onealert Agent ![](http://kmgy.top:9000/image/2022/10/30/202210301412062.png) #### 4.3.1 如何删除 onealert Agent ①删除报警媒介类型中的脚本 ![](http://kmgy.top:9000/image/2022/10/30/202210301412234.jpeg) ②删除创建的用户 ![](http://kmgy.top:9000/image/2022/10/30/202210301412008.jpeg) ③删除用户群组 ![](http://kmgy.top:9000/image/2022/10/30/202210301413810.jpeg) ④删除创建的动作 ![](http://kmgy.top:9000/image/2022/10/30/202210301413935.jpeg) #### 4.3.2 触发器响应,发送报警信息 ![](http://kmgy.top:9000/image/2022/10/30/202210301413359.jpeg) 在微信和邮件中,均能收到报警信息。 ![](http://kmgy.top:9000/image/2022/10/30/202210301401730.png) > 注意:当状态改变的时候才会发邮件 > 好→坏 > 坏→好 ### 4.4 监控可视化 #### 4.4.1 聚合图形 最新数据 >> 图形 ![](http://kmgy.top:9000/image/2022/10/30/202210301401325.png) 自定义名称 ![](http://kmgy.top:9000/image/2022/10/30/202210301401511.png) 点击聚合图形的名称,进行更改,添加要显示的图形即可。 ![](http://kmgy.top:9000/image/2022/10/30/202210301413718.jpeg) #### 4.4.2 幻灯片 添加幻灯片 监测中 >> 复合图形 >> 幻灯片演示 ![](http://kmgy.top:9000/image/2022/10/30/202210301401690.png) 创建幻灯片,名称自定,选择要显示的 幻灯片根据设定的时间自动播放 ### 4.5 模板的共享 #### 4.5.1 主机共享 在主机页打开,全选后点击导出 ![](http://kmgy.top:9000/image/2022/10/30/202210301401692.png) 导入 ![](http://kmgy.top:9000/image/2022/10/30/202210301401099.png) #### 4.5.2 模板共享 > https://github.com/zhangyao8/zabbix-community-repos ![](http://kmgy.top:9000/image/2022/10/30/202210301401053.png) 五、监控全网服务器 --------- 5.1 需求说明 实际需求: 公司已经有了 100 台服务器,现在需要使用 zabbix 全部监控起来。 ### 5.2 规划方案 常规监控:cpu,内存,磁盘,网卡 问题:怎样快速添加 100 台机器 * 方法 1:使用克隆的方式 * 方法 2:自动注册和自动发现 * 方法 3:调用 zabbix api 接口 curl 、python 开发自己的运维平台兼容 zabbix 的通道 服务监控,url 监控等特殊监控:自定义监控 #### 5.2.1 api 接口使用(curl) ![](http://kmgy.top:9000/image/2022/10/30/202210301401732.png) ### 5.3 具体实施规划 #### 5.3.1 硬件、系统、网络监控 所有集群节点(所有虚拟机)都监控上 交换机,路由器监控(简单方法:换成端口对应服务器网卡流量监控;标准方法:监控交换机的网卡) snmp 监控 #### 5.3.2 应用服务监控 1. 监控备份服务器,简单方法是监控 rsync 端口,如果有其他更佳方案可以说明; 方法 1:监控 873 端口 net.tcp.port[,873] 方法 2:模拟推送拉取文件 2. 监控 NFS 服务器,使用监控 NFS 进程来判断 NFS 服务器正常,如果有其他更佳方案可以说明; 方法 1:端口(通过 111 的 rpc 端口获取 nfs 端口) net.tcp.port[,111] 方法 2:showmount -e ip|wc -l 3. 监控 MySQL 服务器,简单方法监控 mysql 的 3306 端口,或者使用 zabbix 提供的 Mysql 模板,如果有其他更佳方案可以说明; 方法 1:端口(通过 3306 的 mysql 端口) net.tcp.port[,3306] 方法 2:mysql 远程登录 方法 3:使用 zabbix agent 自带的模板及 key 4. 监控 2 台 web 服务器,简单方法监控 80 端口,如果有其他更佳方案可以说明; 方法 1:端口(通过 80 的 web 端口) net.tcp.port[,80] 方法 2:看网页状态码、返回内容 ==zabbix 自带 WEB 检测 5. 监控 URL 地址来更精确的监控我们的网站运行正常; 使用 zabbix 自带的监控 Web 监测 进行监控 6. 监控反向代理服务器,PPTP 服务器等你在期中架构部署的服务。 nginx,pptp ntp 端口 udp 123 7. 监控 Nginx 的 7 种连接状态。 自定义监控 #### 5.3.3 监控服务通用方法 1. 监控端口 netstat ss lsof ==》 wc -l 2. 监控进程 ps -ef|grep 进程 | wc -l 试运行一下 3. 模拟客户端的使用方式监控服务端 web ==》 curl mysql ==》 select insert memcache ==》 set 再 get ### 5.4 实施全网监控 安装客户端脚本,for centos6 ![](http://kmgy.top:9000/image/2022/10/30/202210301401925.png) #### 5.4.1 使用自动发现规则 添加自动发现规则 ![](http://kmgy.top:9000/image/2022/10/30/202210301401009.png) 创建发现动作 ![](http://kmgy.top:9000/image/2022/10/30/202210301401459.jpeg) 查看自动发现的机器。 ![](http://kmgy.top:9000/image/2022/10/30/202210301402531.jpeg) ### 5.4.2 监控备份服务器 利用系统自带键值进行监控 net.tcp.listen[port] 创建新的模板 ![](http://kmgy.top:9000/image/2022/10/30/202210301402959.png) 在服务端进行测试 ![](http://kmgy.top:9000/image/2022/10/30/202210301402443.png) 将模板添加到主机 ![](http://kmgy.top:9000/image/2022/10/30/202210301402259.png) #### 5.4.3 监控 NFS 服务器 创建 nfs 监控模板 使用 proc.num[,,,] 键值,检测 nfs 进程的数量 ![](http://kmgy.top:9000/image/2022/10/30/202210301402355.png) 在服务端进行测试 将模板绑定到主机 #### 5.4.4 监控 MySQL 服务器 将自带的 mysqlkey 值加上 mysql 的账户密码,否则不能获取到数据。 ![](http://kmgy.top:9000/image/2022/10/30/202210301402171.jpeg) 使用系统自带模板 net.tcp.port[,port] 利用自带的监控端口键值进行监控 ![](http://kmgy.top:9000/image/2022/10/30/202210301403442.png) 添加新的 mysql 监控项端口 ![](http://kmgy.top:9000/image/2022/10/30/202210301403140.png) ``` [root@m01 ~]# zabbix_get -s 172.16.1.8 -p 10050 -k “proc.num[,,,nginx]”2[root@m01 ~] zabbix_get -s 172.16.1.8 -p 10050 -k “net.tcp.port[,80]”1 ``` 将模板关联到主机 #### 5.4.5 监控 web 服务器 ![](http://kmgy.top:9000/image/2022/10/30/202210301403151.png) 创建监控模板 监控 nginx 服务与 80 端口 ``` echo ok >> /application/nginx/html/www/check.html ``` ![](http://kmgy.top:9000/image/2022/10/30/202210301403918.png) ``` [root@web03 ~]# for ip in 7 8 9 ;do curl 10.0.0.$ip/check.html ;doneok ok ok ``` 将模板关联到主机 #### 5.4.6 监控 URL 地址 创建监测页面 ``` [root@lb01 ~] # cat /etc/zabbix/zabbix_agentd.d/userparameter_nk.confUserParameter=keep-ip,ip a |grep 10.0.0.3|wc -l ``` ``` [root@m01 ~]# zabbix_get -s 172.16.1.5 -p 10050 -k "keep-ip"1[root@m01 ~]# zabbix_get -s 172.16.1.6 -p 10050 -k "keep-ip"0 ``` ``` …… location /status { stub_status on; access_log off; } …… ``` 创建 web 监测模板 创建应用集 ![](http://kmgy.top:9000/image/2022/10/30/202210301404860.png) 创建 Web 场景 ![](http://kmgy.top:9000/image/2022/10/30/202210301404526.png) 创建图形 ![](http://kmgy.top:9000/image/2022/10/30/202210301404145.png) 将模板关联到主机 ![](http://kmgy.top:9000/image/2022/10/30/202210301404804.jpeg) 监测结果 ![](http://kmgy.top:9000/image/2022/10/30/202210301404676.jpeg) #### 5.4.7 监控反向代理服务器 创建自定义 key ``` [root@web01 ~]# for ip in 7 8 9 ;do curl 172.16.1.$ip/status ;doneActive connections: 1server accepts handled requests 73 73 69Reading: 0 Writing: 1 Waiting: 0 Active connections: 1server accepts handled requests 134 134 127Reading: 0 Writing: 1 Waiting: 0 Active connections: 1server accepts handled requests 7 7 7Reading: 0 Writing: 1 Waiting: 0 ``` 在服务端测试 ``` cat >/etc/zabbix/zabbix_agentd.d/userparameter_nginx_status.conf <<'EOF'UserParameter=nginx_active,curl -s 127.0.0.1/status|awk '/Active/ {print $NF}'UserParameter=nginx_accepts,curl -s 127.0.0.1/status|awk 'NR==3 {print $1}'UserParameter=nginx_handled,curl -s 127.0.0.1/status|awk 'NR==3 {print $2}'UserParameter=nginx_requests,curl -s 127.0.0.1/status|awk 'NR==3 {print $3}'UserParameter=nginx_reading,curl -s 127.0.0.1/status|awk 'NR==4 {print $2}'UserParameter=nginx_writing,curl -s 127.0.0.1/status|awk 'NR==4 {print $4}'UserParameter=nginx_waiting,curl -s 127.0.0.1/status|awk 'NR==4 {print $6}'EOF ``` 在 web 界面添加模板 ![](http://kmgy.top:9000/image/2022/10/30/202210301404676.jpeg) 将模板关联到主机 #### 5.4.8 监控 Nginx 的 7 种连接状态 nginx 服务器显示 status ``` [root@m01 ~]# zabbix_get -s 172.16.1.7 -p 10050 -k "nginx_waiting"0 [root@m01 ~]# zabbix_get -s 172.16.1.8 -p 10050 -k "nginx_waiting"0 [root@m01 ~]# zabbix_get -s 172.16.1.9 -p 10050 -k "nginx_waiting"0 ``` ``` zabbix Server主动发现所有客户端,然后将客户端登记自己的小本本上,缺点zabbix server压力山大(网段大,客户端多),时间消耗多。 ``` 在 nginx 服务器上添加 key ``` zabbix agent主动到zabbix Server上报到,登记;缺点agent有可能找不到Server(配置出错) ``` 服务端测试 ``` zabbix Server ===》 zabbix proxy ===》zabbix agent1 agent2 agent3 。。。172.16.1.61 172.16.1.21 172.16.1.0/24 ===》 zabbix proxy ===》zabbix agent4 agent5 agent6 。。。 ``` 在 zabbix-web 上添加 ![](http://kmgy.top:9000/image/2022/10/30/202210301405703.png) 监控项 ![](http://kmgy.top:9000/image/2022/10/30/202210301405657.jpeg) 添加图形 ![](http://kmgy.top:9000/image/2022/10/30/202210301405079.png) 将模板关联到主机 ![](http://kmgy.top:9000/image/2022/10/30/202210301405955.jpeg) 查看添加的图形 ![](http://kmgy.top:9000/image/2022/10/30/202210301405877.jpeg) 六、自动发现与自动注册 ----------- ### 6.1 自动注册与自动注册 #### 6.1.1 简介 自动发现: ``` zabbix Server(北京) ==》 zabbix proxy(每个机房搭建) ==》 zabbix agent 122.71.240.233/172.16.1.61 122.71.241.11/172.16.2.21 172.16.2.0/24 ``` 自动注册: ``` zabbix server m01 zabbix proxy cache01 zabbix agent cache01 ``` #### 6.1.2 两种模式 * 被动模式:默认 agent 被 server 抓取数据 (都是在 agent 的立场上说) * 主动模式:agent 主动将数据发到 server 端 (都是在 agent 的立场上说) > 注意:两种模式都是在 agent 上进行配置 > zabbix 的使用要在 hosts 文件中预先做好主机名的解析 ### 6.2 自动发现—被动模式 * 第一个里程碑:完成之前的安装 zabbix Server 安装完毕 * 第二个里程碑:配置 agent 客户端 zabbix agent 安装完毕,注意配置 Server=172.16.1.61 * 第三个里程碑:在 web 界面上进行配置 web 界面:配置 >> 自动发现 >> Local network 使用自带的自动发现规则(进行修改)即可 在 ip 范围内输入 ip,注意格式; 延迟在实际的生产环境中要大一些,实验环境可以小一些 创建发现动作 配置 >> 动作 >> Auto discovery. Linux servers. ① 配置动作 ![](http://kmgy.top:9000/image/2022/10/30/202210301405948.png) ② 在条件中添加条件,让添加更准确 ![](http://kmgy.top:9000/image/2022/10/30/202210301406834.jpeg) ③ 在操作中添加 a) 添加主机与启用主机 ![](http://kmgy.top:9000/image/2022/10/30/202210301406164.png) 七、分布式监控与 SNMP 监控 ---------------- ### 7.1 分布式监控 #### 7.1.1 作用 分担压力,减轻负载 多机房监控 zabbix Server ===》 zabbix agent (只能同一个局域网监控) 分担压力,降低负载 ``` rpm -ivh http://repo.zabbix.com/zabbix/3.0/rhel/7/x86_64/zabbix-release-3.0-1.el7.noarch.rpm yum install zabbix-proxy-mysql -y ``` 多机房监控 ``` yum -y install mariadb-server systemctl start mariadb.service ``` #### 7.1.2 环境说明 ``` create database zabbix_proxy character set utf8 collate utf8_bin; grant all privileges on zabbix_proxy.* to zabbix@'localhost' identified by 'zabbix'; exit ``` #### 7.1.2 配置 zabbix proxy 第一个里程碑:配置 zabbix yum 源,并安装 proxy ``` zcat /usr/share/doc/zabbix-proxy-mysql-3.0.13/schema.sql.gz |mysql -uzabbix -pzabbix zabbix_proxy ``` 第二个里程碑:安装数据库 zabbix proxy 也需要数据库,这个数据库不是用于存储监控数据的 只是用于存储配置信息 安装数据库 ``` sed -i.ori '162a DBPassword=zabbix' /etc/zabbix/zabbix_proxy.conf sed -i 's#Server=127.0.0.1#Server=172.16.1.61#' /etc/zabbix/zabbix_proxy.conf sed -i 's#Hostname=Zabbix proxy#Hostname=cache01#' /etc/zabbix/zabbix_proxy.conf# Hostname ``` 建立数据库 ``` systemctl restart zabbix-proxy.service ``` 导入数据文件 ``` [root@cache01 ~]# netstat -lntup |grep zabbix tcp 0 0 0.0.0.0:10050 0.0.0.0:* LISTEN 105762/zabbix_agent tcp 0 0 0.0.0.0:10051 0.0.0.0:* LISTEN 85273/zabbix_proxy tcp6 0 0 :::10050 :::* LISTEN 105762/zabbix_agent tcp6 0 0 :::10051 :::* LISTEN 85273/zabbix_proxy ``` 配置 zabbix proxy 连接数据库 ``` [root@cache01 ~] # grep ^Server /etc/zabbix/zabbix_agentd.confServer=172.16.1.61ServerActive=172.16.1.61 [root@cache01 ~] # sed -i 's#172.16.1.61#172.16.1.21#g' /etc/zabbix/zabbix_agentd.conf [root@cache01 ~] # grep ^Server /etc/zabbix/zabbix_agentd.confServer=172.16.1.21ServerActive=172.16.1.21[root@cache01 ~] # systemctl restart zabbix-agent.service ``` 作为后面添加的代理程序名称,要保持一致 启动 ``` yum -y install net-snmp net-snmp-utils ``` 检查端口 ``` sed -i.ori '57a view systemview included .1' /etc/snmp/snmpd.conf systemctl start snmpd.service ``` 第三个里程碑:修改 agent 配置指向 proxy ``` [root@m01 ~]# snmpwalk -v 2c -c public 127.0.0.1 sysnameSNMPv2-MIB::sysName.0 = STRING: m01 ``` 第四个里程碑:web 界面添加代理 管理 >> agent 代理程序 >> 创建代理 ![](http://kmgy.top:9000/image/2022/10/30/202210301406172.png) 代理程序名称要填写主机名 ![](http://kmgy.top:9000/image/2022/10/30/202210301406553.jpeg) 稍等片刻就能在程序中出现代理 ![](http://kmgy.top:9000/image/2022/10/30/202210301407812.png) 在主机中能发现主机代理 ![](http://kmgy.top:9000/image/2022/10/30/202210301416791.png) ### 7.2 SNMP 监控 #### 7.2.1 使用范围 无法安装 agent 很多前辈的监控软件都可以监控各种设备 都是通过 snmp 监控 snmp simple network manager protocol 简单网络管理协议 简单网络管理协议(SNMP),由一组网络管理的标准组成,包含一个应用层协议(application layer protocol)、数据库模型(database schema)和一组资源对象。该协议能够支持网络管理系统,用以监测连接到网络上的设备是否有任何引起管理上关注的情况。 #### 7.2.2 安装 snmp 程序 ``` yum -y install net-snmp net-snmp-utils ``` #### 7.2.3 配置 snmp 程序 #### 7.2.4 测试 snmp ``` [root@m01 ~]# snmpwalk -v 2c -c public 127.0.0.1 sysnameSNMPv2-MIB::sysName.0 = STRING: m01 ``` 说明: > * snmpwalk 类似 zabbix_get > > * -v 2c 指定使用 snmp 协议的版本 snmp 分为 v1 v2 v3 > > * -c public 指定暗号 > > * sysname 类似 zabbix 的 key #### 7.2.5 在 web 界面进行配置 添加新的主机,注意使用 snmp 接口 ![](http://kmgy.top:9000/image/2022/10/30/202210301416791.png) 选择模板,注意使用 SNMP 的模板 ![](http://kmgy.top:9000/image/2022/10/30/202210301416791.png) 添加完成就能够在主机中看到 snmp 监控对的主机 ![](http://kmgy.top:9000/image/2022/10/30/202210301416791.png) ``` - END - ```
yg9538
2022年10月30日 14:19
593
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
PDF文档
PDF文档(打印)
分享
链接
类型
密码
更新密码