当前位置: 澳门新濠3559 > 服务器运维 > 正文

监控宝的监测点网络采用集中管理、分布服务模

时间:2019-11-08 03:17来源:服务器运维
近日,云智慧(北京)科技有限公司宣布,监控宝第一季度的产品和基础监测点升级部署计划已经提前完成。本次服务升级主要包含:监测点网络部署、产品体验优化和部分套餐优惠调整

近日,云智慧(北京)科技有限公司宣布,监控宝第一季度的产品和基础监测点升级部署计划已经提前完成。本次服务升级主要包含:监测点网络部署、产品体验优化和部分套餐优惠调整等几个方面。其中标准、高级、专业套餐均为用户免费增加了2个监控点,并且标准套餐降价优惠了48%,提高产品服务品质的同时,帮助用户降低运维成本。

架构规划

原文网址链接:
随着云计算和互联网的高速发展,大量应用需要横跨不同网络终端,并广泛接入第三方服务(如支付、登录、导航等),IT系统架构越来越复杂。快速迭代的产品需求和良好的用户体验,需要IT运维管理者时刻保障核心业务稳定可用,而企业运维中的痛点和难点也急需解决。

随着江西电信监测点的正式投入运营,监控宝独立部署的监测点已经达到35个,覆盖全国主要地区以及中国电信、中国联通、中国移动和教育网等网络服务商。除了监测点外,监控宝在网络带宽质量也进行了全面的增配扩容,提高监测点服务响应时间和可用能力。在安全和稳定性方面,通过在同一区域部署不同数据中心的监测点,减少单点故障损失,提高系统可用率。监控宝的监测点网络采用集中管理、分布服务模式,向用户提供一点受理、全网服务的高效运营服务保障。

产品、架构、成本的生命周期

  • 引入期,通常采用灰度放量,例如发放邀请码。
  • 成长期,用户基数增长、产品逐渐丰富、系统模块化,宽带成本开始成为主成本。
  • 成熟期,增长放缓,活跃度达到顶峰。架构优化调整:多IDC部署,逻辑层服务分布式和集群部署,P级分布式存储,分布式DB与Cache,数十G到数百G带宽成本。
  • 衰退期,新产品或替代品出先,用户开始流失,架构沉淀完成,架构开始平台化,升级到部门甚至公司级别。

负载均衡、架构、速度、容灾、与成本的把控,既要满足阶段性需要,保持可扩展性,又不能超出计划。

产品第一,运营制胜。

澳门新濠3559 1

  • 质量、速度、成本
  • 专业化、平台化、持续化
  • 可伸缩、可调度、可扩展
  • 标准化、规范化、模块化
  • 全网调度,速度与容灾
  1. 面向业务的运维,不但关心单点IT资源的运行状态,更关心整个业务系统的健康状态

  2. 如果企业使用了大量的API和模块化应用,那么关注每个接口的性能变化情况和指标

  3. 对于运维主管及企业管理层来说,特别需要上墙的监控大屏

  4. 运维需要每周、每月查看报告趋势分析,但传统运维工具数据导出困难

  5. 需要第一时间转雀和快速发现故障节点,减少业务中断带来的损失

产品升级方面主要是内容监控和全景监控服务。内容监控增加了快照对比监测状态,优化了按照区域划分监测目标范围,改善了链接审计和非法域名的区分,对发现的变化不论是在服务器端、内网环节还是外部公网环节以何种方式进行了哪种篡改,用户都会在第一时间找到问题所在,降低运营风险。全景监控从用户使用的视角在图形展示、数据表现等方面优化了产品体验,让用户更加直观的了解性能状态。另外,API监控将在近期正式上线,支持多种认证方式,满足用户对API接口调用性能的监控需求。

分布

  • 多ISP分布,BGP或多线IDC
  • 多IDC

云智慧对业内主流的开源运维监控系统和商业运维监控系统进行对比,分析各种产品的定位、目标用户和功能特点,希望帮助广大运维、开发和创业者找到最适合自己的运维工具。

监控宝CEO殷晋介绍:“到2014年底,监控宝的监测点将接近60个,所有监测点都将支持内容监控、事务监控和全景监控,实现除新疆、西藏等地区覆盖国内主要城市和海外的监控网络。此次升级不仅仅是产品功能和价格的调整,更是产品应用化与运营服务能力的优化整合。随着API监控、oracle数据库等企业级应用监控以及私有云监控的不断完善,监控宝已基本形成由内而外的立体云监控服务,覆盖个人、企业和行业用户的产品策略体系,是国内APM的具体落地与产业化实践。”

监控宝的监测点网络采用集中管理、分布服务模式,云智慧对业内主流的开源运维监控系统和商业运维监控系统进行对比。策略

  • 静态资源,中心IDC与CDN,一线城市IDC重点覆盖,CDN做省内覆盖。
  • 动态内容,主要依靠多IDC之间专线做Qos或透明代理。
  • 就近接入,按IDC所在区域覆盖。

开源运维监控产品篇

...

调度

  • GSLB分POOL调度,每个POOL对应就近各省及ISP解析。
  • 灾备,通过GSLB进行区域或某同ISP的IDC所负责的用户覆盖的调度。
![](https://upload-images.jianshu.io/upload_images/5486077-4f5ed090e292e96a.jpg)

Zabbix

架构概览

  • 动静分离
  • 静态、动态架构拆分再拆分。Web Server 定制,产品平台化,应用平台化,架构平台化,运维和运营平台化。
  • 核心IDC+多家CDN分流,IDC容灾,区域容灾。
  • 高速跨IDC、ISP分发能力。
  • PB级存储,可伸缩,易扩容,逻辑转存,冷热分离。

澳门新濠3559 2

推荐星级:五颗

IDC策略、分布制胜、速度第一

Zabbix是一个基于WEB界面的提供分布式系统监控以及网络监控功能的企业级开源运维平台,也是目前国内互联网用户中使用最广的监控软件,云智慧遇到的85%以上用户在使用Zabbix做监控解决方案。

用户访问过程

  • 浏览器输入域名
  • 浏览器向本地DNS请求解析
  • 本地DNS将请求发送到网站授权的DNS服务器(涉及根DNS)
  • 授权DNS将服务器的IP地址发送给本地DNS
  • 本地DNS将解析结果返回给用户,同时将结果缓存,直到TTL过期
  • 用户得到IP,访问IP指向的服务器

澳门新濠3559 3

影响速度的三个环节

  • 第一公里,服务器出口宽带、服务器性能
  • 中间一公里,互联网传输环节、运营商互联互通、骨干网络设备和链路
  • 最后一公里,ADSL、有线电视宽带、小区Lan接入状况

入门容易、上手简单、功能强大并且开源免费是云智慧对Zabbix的最直观评价。Zabbix易于管理和配置,能生成比较漂亮的数据图,其自动发现功能大大减轻日常管理的工作量,丰富的数据采集方式和API接口可以让用户灵活进行数据采集,而分布式系统架构可以支持监控更多的设备。理论上,通过Zabbix提供的插件式架构,可以满足企业的任何需求。

IDC规划

  1. 将全国分为华北、华东、华南、西南、西北五大区域,分区域、分运营商、按用户比例精细化IDC覆盖。
  2. 针对电信、联通大省进行省内IDC覆盖,如:广东电信、山东联通
  3. 大区IDC以省为单位的CDN,缓解骨干网络和分流大区核心IDC压力,提升速度、降低带宽成本

用户群:85%以上的泛互联网企业。

速度

优点:

网站速度关键指标

  • 首屏时间:浏览器完成第一屏渲染的时间
  • 总下载时间:打开页面总消耗时间
  • 首包时间:从浏览器发送HTTP请求结束到结束到Web服务器返回到第一个数据包
  • 建立连接时间:建立TCP/IP连接消耗时间
  • DNS时间:域名解析消耗的时间
  • 总下载字节数:页面所有元素的大小之和
  • 网页元素数量:元素数量越多,与服务器交互越多,网络传输及通讯越频繁(js、css、图片等)
  • 基础页面下载时间:即服务器返回多纯文本HTML文件(网页第一个请求),含DNS解析、TCP/IP建立、SSL握手等时间总和,决定了首屏体验。
  1. 支持多平台的企业级分布式开源监控软件

  2.  安装部署简单,多种数据采集插件灵活集成

  3. 功能强大,可实现复杂多条件告警,

  4. 自带画图功能,得到的数据可以绘成图形

  5. 提供多种API接口,支持调用脚本

  6. 出现问题时可自动远程执行命令(需对agent设置执行权限)

影响速度等因素

  • 横向
    • 用户端:地域性、ISP属性
    • 网络端:中国网络基础环境复杂度(例如:长城?哈哈)、网络运营商(运营、通信、互联)、IDC和ISP分布
    • 服务器端:服务器配置、性能优化、系统优化
  • 纵向
    • 产品形态(产品规划复杂度、产品功能数量)
    • 设计、前端
    • 架构规划
    • 后端开发

澳门新濠3559 4

缺点:

网站速度监控

澳门新濠3559 5

  1. 项目批量修改不方便

  2. 社区虽然成熟,但是中文资料相对较少,服务支持有限;

  3. 入门容易,能实现基础的监控,但是深层次需求需要非常熟悉Zabbix并进行大量的二次定制开发,难度较大;

  4. 系统级别报警设置相对比较多,如果不筛选的话报警邮件会很多;并且自定义的项目报警需要自己设置,过程比较繁琐;

  5. 缺少数据汇总功能,如无法查看一组服务器平均值,需进行二次开发;

  6. 数据报表需要特殊二次开发定义;

网站速度优化

  • 最少请求量
  • tab页面异步加载或延迟加载
  • 合并 js/css文件
  • Css Sprites
  • 统一公用 js/css
  • 合并Ajax请求
  • 避免重定向
  • 减少iframe请求
  • 滚屏延迟加载
  • 多级缓存
  • 最快请求速度
  • 设置页面缓存
  • 请求结果缓存
  • Cookie隔离
  • 动静分离
  • 选择合适的服务器
  • 适当使用多域名增加并行下载
  • 设置Gzip压缩
  • 多IDC部署,动态内部代理
  • 使用CDN
  • 提高IP库定位能力
  • 图片压缩
  • 图片预加载
  • js/css混淆
  • 页面代码压缩
  • 减少cookie大小
  • 逻辑层协议合并、并行处理
  • 数据、索引内存、SSD并行写
  • 最快可见可用
  • 首屏优化原则
  • 减少元素数量、size
  • 前端代码减肥
  • js性能优化 css+div布局
  • js底部加载,按需加载,延迟加载,预加载

澳门新濠3559 6

澳门新濠3559 7

Nagios

监控

  • 第一阶段:以第三方质量监控和开源系统监控为核心。
  • 第二阶段:自建运营平台,实现应用、质量、容量监测,对应用层、数据层监控。
  • 第三阶段:以ITIL事件管理、问题管理、变更管理、配置管理、发布管理5大流程为核心,建立全流程电子流体系,平台化支撑规模化。
  • 澳门新濠3559,访问监控,过去用户访问速度
  • URL监控,服务实时访问状态
  • 劫持监控,了解全国劫持状态
  • 内容监控,编写爬虫抓取页面

推荐星级:四颗

机器监控实践

通过Agent将服务器实时系统数据上报,实现系统秒级监控以及对服务器数据进行汇聚、建模、展现和警告。运营数据包括系统CPU、负载、磁盘、连接数、内存、带宽、IDC带宽等。

澳门新濠3559 8

Nagios是一款开源的企业级监控系统,能够实现对系统CPU、磁盘、网络等方面参数的基本系统监控,以及SMTP,POP3,HTTP,NNTP等各种基本的服务类型。另外通过安装插件和编写监控脚本,用户可以实现应用监控,并针对大量的监控主机和多个对象部署层次化监控架构。

网络监控实践

  • 第三方监控:IDC维度,ISP维度(自身业务上报)
  • 自建监控:js上报
  • 响应监控:IDC内服务响应
  • 域名监控:DNS解析

澳门新濠3559 9

应用监控实践

  • 模块监控:动态应用模块监控
  • 数据库监控:数据库运行可视化

澳门新濠3559 10

澳门新濠3559 11

Nagios最大的特点是其强大的管理中心,尽管其功能是监控服务和主机的,但Nagios自身并不包括这部分功能代码,所有的监控、告警功能都是由相关插件完成的。

安全

  • web漏洞扫描
  • xss
  • csrf
  • sql注入
  • cgi漏洞
  • 缓冲溢出
  • 域名劫持扫描
  • DDos攻击扫描
  • 流量攻击
  • 资源耗尽攻击
  • 敏感信息扫描
  • 网页篡改扫描

澳门新濠3559 12

用户群:适合复杂IT环境的企业

优点:

  1. 出错的服务器、应用和设备会自动重启,自动日志滚动

  2. 配置灵活,可以自定义shell脚本,通过分布式监控模式

  3. 支持以冗余方式进行主机监控,报警设置多样

  4. 命令重新加载配置文件无需打扰Nagios的运行

缺点:

  1. 事件控制台功能很弱,插件易用性差

  2. 对性能、流量等指标的处理不给力

  3. 看不到历史数据,只能看到报警事件,很难追查故障原因

  4. 配置复杂,初学者投入的时间、精力和成本比较大

Ganglia

推荐星级:四颗

Ganglia是加州大学伯克利分校发起的一个开源集群监控项目,设计之初是用于监控数以千计的网络节点。Ganglia是一个跨平台可扩展的,高性能计算系统下的分布式监控系统。它已被广泛移植到各种操作系统和处理器架构上。

澳门新濠3559 13

用户群:适用于大型服务器集群用户。

优点:

  1. 适合监控系统性能,通过曲线很容易见到每个节点的工作状态

  2. 可以自定义监控项,监控展示有表格和图像两种,支持手机版

  3. 部署方便,通过不同的分层管理上万台机器,无需逐个添加配置

缺点:

  1. 没有内置的消息通知系统

  2. 没有报警机制,出现问题不能够及时报警

Zenoss

推荐星级:四颗

Zenoss Core是Zenoss的开源版本,其商用版本为ZenossEnterprise。作为企业级智能监控软件,Zenoss Core允许IT管理员依靠单一的WEB控制台来监控网络架构的状态和健康度。Zenoss Core的强大能力来自于深入的列表与配置管理数据库,以发现和管理公司IT环境的各类资产。Zenoss同时提供与CMDB关联的事件和错误管理系统,以协助提高各类事件和提醒的管理效率。

澳门新濠3559 14

优点:

  1. Zenoss比较出色的地方在于它的Dashboard,可以配置很多portlet

  2. 每个用户的界面都是分开管理的,自定义dashboard不会影响其他用户

  3. 强大监控功能支持服务器、路由交换、防火墙、存储、数据库、中间件监控

  4. 采用基于HBASE的opentsdb存储任意时间段的数据

  5. 将状态监控,性能监控,资源管理,良好的报告机制进行有机的整合

缺点:

  1. 对资源要求较高,即使只管理少数几台设备,也需要消耗大量硬件及内存等附加资源。

  2. 针对windows系统,开源版只提供SNMP,通过WMI检测CPU,Disk,软硬件和性能只在收费版提供。

Open-falcon

推荐星级:三颗

Open-falcon是小米运维团队从互联网公司的需求出发,根据多年的运维经验,结合SRE、SA、DEVS的使用经验和反馈,开发的一套面向互联网的企业级开源监控产品。

澳门新濠3559 15

 

                                Open-falcon架构

用户群:目前有几十家企业用户不同程度使用。

优点:

  1. 自动发现,支持falcon-agent、snmp、支持用户主动push、用户自定义插件支持

  2. 支持每个周期上亿次的数据采集、告警判定、历史数据存储和查询

  3. 高效的portal、支持策略模板、模板继承和覆盖、多种告警方式、支持callback调用

  4. 单机支撑200万metric的上报、归档、存储

  5. 采用rrdtool的数据归档策略,秒级返回上百个metric一年的历史数据

  6. 多维度的数据展示,用户自定义Screen

  7. 通过各种插件目前支持Linux、Windows、Mysql、Redis、Memache、RabbitMQ和交换机监控。

缺点:由于发布时间较短,很多基础的服务监控插件(如Tomcat、apache等)还不支持,很多功能还在不断完善中,另外由于缺少专门的支持,虽然有开放社区,但是解决问题的效率相对较低。

商用运维监控系统篇

监控宝

推荐星级:五颗

监控宝是云智慧为用户提供IT性能监控(IT Performance Monitoring)的SaaS产品,包含网站监控、服务器监控、中间件监控、数据库监控、应用监控、API监控和页面性能监控等功能。包含免费版、畅享版和企业版,目前用户约40万,监控宝app也是国内唯一提供移动监控服务的产品。

澳门新濠3559 16

用户群:覆盖电子商务、移动互联网、广告传媒、在线游戏、教育医疗等行业的几十万用户,小米、陌陌、高德、用友、金山、途牛、聚美优品、陆金所、中国平安、建行信用卡中心、春雨医生、畅游、国家电网、中国电信、滴滴打车、春秋航空、凤凰网等各行业领先企业和中国互联网百强企业超过30%在使用监控宝。

优点:

  1. 作为国内最早提供基于SaaS服务的网络监控平台,监控宝不但为初级用户提供免费的标准服务,企业用户还可以按需购买所需的监控、告警资源,最大限度的节省企业运维成本;

  2. 监控宝通过遍布全球的300多个分布式监测节点,对网络进行稳定性和可用性的主动监控和实时分析,支持http(https)、ftp、ping、udp、tcp、smtp、traceroute等多种协议,测量CDN效果及DNS状态,全网全地域性能趋势分析。

  3. 实时捕捉服务器深层性能指标,支持Linux/Unix/Windows系统及云平台,支持CPU使用率、CPU平均负载、内存使用比例、磁盘IO、磁盘空间使用率、网络流量和系统进程数统计等物理指标及30多种应用服务,云主机监控端一键开启,无需复杂配置。对于应用服务的监控,监控宝已经支持常见的应用类型包括:Apache、Lighttpd、Nginx、Tomcat、IIS、Memcache和Redis,存储层监控支持Hadoop、MySQL、MongoDB、SQLServer、Oracle的健康状态及性能监控。

  4. 监控宝是国内目前唯一支持API监控的网络监控产品,通过API接口调用模拟用户使用过程,支持对get、post、put、delete、head、options六种请求方式进行实时监控;支持JSON、XML、Text、Response Status验证及Postman脚本导入。

  5. Docker监控也是监控宝的独家功能,能够实时监控Docker容器的CPU、内存、网络流量及Swap状态,让开发者和运维人员在使用Docker时清晰掌握其资源消耗状况。

  6. 监控宝提供页面性能管理,基于国际标准制定页面性能指数,识别加载元素的状态及正确性,对全网全用户加载响应时间分析,同时准确定位问题元素及优化建议。

  7. 及时有效的告警通知对运维来说至关重要,监控宝可以根据SLA设置告警阈值,第一时间发送告警通知。监控宝覆盖最全面的告警通知方式:电子邮件、短信、电话语音、URL回调通知、App Push等。另外监控宝提供分级告警通知,能够根据告警事件的不同等级将不同的告警推送给不同的人员,支持企业分层管理!

  8. 监控宝目前对其Smart Agent进行了开源,用户可以根据业务需求定制化开发Agent,同时用户的数据安全得到保障。

  9. 监控宝提供私有化部署解决方案,满足政企、金融行业专有网络监控的需求。

  10. 来自Compuware、CA、IBM等企业IT服务资深专家,超过5年的本土化企业级SaaS服务经验,以及超过百人的技术服务团队,为用户提供最佳的服务保障。

360网站服务监控

推荐星级:两颗

360网站服务监控是一款面向广大站长的网站监控产品,提供免费的网站、服务器监控。

澳门新濠3559 17

用户群:个人站长

优点:

  1. 服务免费,支持网站HTTP监控、PING监控、域名DNS监控和服务器监控

  2. 提供网站访问全景数据和简单配置信息

缺点:

  1. 只支持简单的网站和服务器监控,历史数据保留15天,且免费监控点数量仅为四个

  2. 最后一次产品更新是2014年9月,目前已停止更新和运营支持

阿里云监控

推荐星级:四颗

阿里云监控是一款免费网站监控产品,可监控站点和服务器,并提供多种告警方式:短信,旺旺,邮件。

澳门新濠3559 18

用户群:阿里云用户

优点:

  1. 与阿里云服务捆绑紧密,允许用户自定义数据监控

  2. 阿里云多IDC间内网数据传输,不占用客户公网资源

  3. 支持对业务数据的通用统计,从各个角度反应服务的运行情况

缺点:

  1. 所有服务基于阿里云,功能单一,扩展性差

  2. 功能不够强大,只能满足基础监控需求

百度云观测

推荐星级:两颗

百度云观测是百度推出的一款云服务产品,类似于360云监控、阿里云监控,主要是为站长提供免费的一站式网站监测、预警服务,功能覆盖网站运行状况、安全和访问速度等多个方面。

澳门新濠3559 19

用户群:个人站长

优点:

  1. 对于用户每日访问的站点进行安全检测

  2. 国内各大城市云节点覆盖,支持CDN、DNS状态和主机监控

缺点:

  1. 需要进行网站认证

  2. 监控点少,功能简单,只能监测网站状态,不支持服务器、应用监控。

小蜜蜂网站监测

推荐星级:一颗

小蜜蜂网站监测是一款针对中小企业需求开发的综合测量网站运营情况线上工具,可以定时监控网站或服务器器的可用率(Uptime),一旦网站无法连结、或是服务器发生错误,即可发送告警通知。

澳门新濠3559 20

用户群:中小企业网站管理员

优点:

  1. 小蜜蜂通过探测节点和Last Mile两种模式监测网站可用性,支持多种站点监控类型和不同的网络访问传输协议;

  2. 提供多样化监控告警设置,并支持站内实时告警消息,支持RSS。

缺点:

  1. 只支持基本的网站监控,监控点不可选,监控服务不稳定;

  2. 网站性能历史数据不够详细,且无法导出。

随着新技术的不断发展,云服务已经互联网企业的必须,但是长期以来会存在传统物理主机和云主机、私有云和公有云并存的状态。此外,互联网企业的发展速度非常快,小米、滴滴出行等很多企业都是在短短几年内发展起来的,因此选择一款合适的云监控产品,伴随企业同步成长,是非常必要的。

编辑:服务器运维 本文来源:监控宝的监测点网络采用集中管理、分布服务模

关键词: