当前位置: 澳门新濠3559 > 服务器运维 > 正文

IT企业使用开源云软件平台来构建私有云,保证复

时间:2019-11-08 03:17来源:服务器运维
事实证明,即使是见多识广、经验丰富的IT人员,在管理复杂的服务器整合项目时也很容易犯错误如何避免服务器整合走弯路。 JoeLatrell是美国宾夕法尼亚州一家房地产数据服务公司的

事实证明,即使是见多识广、经验丰富的IT人员,在管理复杂的服务器整合项目时也很容易犯错误如何避免服务器整合走弯路。  Joe Latrell是美国宾夕法尼亚州一家房地产数据服务公司的IT经理兼首席编程员,他说:“服务器整合时一定要考虑到方方面面。这里面可能有雷区,危机四伏。”

每个有汽车的人都知道,定期更换机油和更换轮胎有助于汽车行驶更顺畅、寿命更长久,从而保护现有投入。同样,采取几个预防性措施也可以帮助数据中心的服务器运行更顺畅、寿命更长久。而更为重要的是,这些措施有助于防止服务器出现停运;在一些情况下,服务器停运很快就会导致蒙受巨额经济损失。

SQLSERVER DBA容易犯的十个错误

翻译自:

除了排名前十的错误之外,其他排名靠前的错误

抛开SQL Server方面的错误,这些错误主要体现在开发或者是设计的时候:

1、不合理的规范和不合理的数据库设计

2、没有设计好可伸缩性的需求

3、没有数据库性能基线或基准

4、索引的问题

5、对语句调优不够重视


错误倒数第十位(磁盘-只要磁盘空间充足就不理会磁盘IO了)

经常只考虑磁盘子系统的磁盘空间,不理会IO负载

没有足够的专业知识,有可能会出现以下问题:

选择了不恰当的容错机制

IO性能不足:

OLTP系统需要较高的TPS

OLAP需要较高的传输速度

选择了较差的RAID类型、控制器、通道

没有足够的磁盘主轴

SSD固态硬盘可以改变这个IO游戏的规则


错误倒数第九位(对业务规则不理解)

作为一位IT PRO,你应该知道SQL Server内部是如何工作的

什么是checkpoint?什么是Lazy writer?

TempDB的使用方式是怎样的?plan cache里面有什么?

你要知道DBA是企业资产数据的保护者

业务和IT之间的联系,你应该知道如何以及在何种方式使用您的服务器

当程序down掉的时候谁会在意,每分钟的停机时间公司需要损失多少钱?

商业周期是什么?

什么时候是最好的宕机?

 

什么样的的基线、基准是正常的?


错误倒数第八位(没有一套自己的故障排除方法)

危急时,DBA需要一个强大的、一步一步的方法进行根源分析。

如果没有,你将会:

1、错过了数据库的错误和问题

2、由于错误引起的数据丢失或者灾难性的问题

3、很差的响应时间或者会违反SLA服务级别协议

4、失去信誉

如果您还没有一套方法论,那么可以参考 

End-to-End Troubleshooting on

SQL Server Troubleshooting Guide by J. Kehayias on


错误倒数第七位(基本上都使用默认值)

使用默认值安装SQL Server安装的目的是尽快让服务器启动并运行

但是这样会造成运行时得不到最优,例如如下设置:

数据库自动增长 、自动收缩

数据库自动增长的大小

默认文件组

一些小问题也会成为大问题

1、并行度

2、填充因子

其他一些服务器和数据库的设置选项

澳门新濠3559 1


错误倒数第六位(在事后才想起数据库的安全性)

现在互联网上面的SQL 注入漏洞成为第一位

值得注意的是,十年前很多关于防SQL注入的方法,直到今天我们依然继续在使用

提前计划好使问题最小化:

确保您的服务器上运行的应用程序只有最小的权限,并且这个权限能够保证你的程序能正常运行

你的服务器暴露面有多少?暴露越多受攻击面就越广

谁有权访问你的服务器?

当出问题的时候你如何找出谁开了一些不恰当的权限?


错误倒数第五位(没有充分使用自动化)

自动化能减轻DBA的很多工作,讽刺的是,一开始DBA就需要将大量的工作进行自动化

没有自动化,DBA必须面对下面问题:

如果全靠人去操作有可能容易出错和遗漏

当服务器的数量增加的时候你的工作将会加倍

使用自动化的例子:

自动报错通知

维护计划作业

基本都是脚本,而不需要使用GUI


错误倒数第四位(在工作上使用了不合适的功能或技术)

DBA是公司里IT程序的“性能工程师”

他的工作是对于每个业务需求使用最合适的功能

否则就会:

使应用程序变复杂

过度的资源消耗

有一条定理:没有IT的项目,只有利用IT解决商业项目


错误倒数第三位(对管理的变更很冷漠)

变更管理是很重要的!没有管理变更,dba将面临:

如果不变,那么他们所做的事情将会更加糟糕

 

改变控制对改变管理

合理的管理改变意味着:

在规定好的时间限制里面预先规划好时间

在生产环境里面,管理改变的好坏会被验证和测试

改变是隔离的、原子的、可逆的


错误倒数第二位(不恰当的维护计划)

适当的预防性维护(PM)可以帮助您:

在出现问题之前抓住问题

能确定优化方向

用户在系统上执行资源密集型的操作会减少

预防性维护在SQLSERVER里应该包括

数据库一致性检查和DBCC CHECKIDENT

备份和还原数据库的时候使用校验选项

索引填充因子、碎片整理

索引统计信息

不要依赖数据库维护计划向导!!

不用重复做轮子,有很多维护计划已经有仙人帮我们写好了

www.sqlfool.com 

www.olahallengren.com


错误倒数第一位(备份和还原)

DBA不会经常验证备份的可用性

这会带来一些问题:

您对客户的SLA不能保证,还有RTO和RPO不能保证

没人能确保备份可用

 

 

如有不对的地方,欢迎大家拍砖o(∩_∩)o 

服务器虚拟化项目通常很容易从财务和运营的角度证明其必要性,但这不能保证项目执行起来万无一失。整合项目的负责人和团队成员几乎在每个阶段都会掉入陷阱,比如规划不充分、想法不完善,或者没有迅速发现部署后的故障。

为了让你的服务器在最佳状况下运行,你需要保持合适的环境、积极主动地维护和监控,并且制定一项计划,那样万一服务器果真出现了故障,员工知道该怎么做。

混合云架构困难重重。

澳门新濠3559 2

保持良好适宜的机房环境

首先,方案的整体规划,需要将传统的本地IT架构和公开以及私有云部署融合在一起,涵盖不同系统的集成,同时还要保证安全性。为这样的规划做准备需要海量的管控工作。管理如此多样复杂的新环境令众多企业烦恼不堪。错误不可避免——有时候还是重大失误。

Joe Latrell说:“每次我们都觉得面面俱到,每个方面都考虑过了,但总是会出现危险。”他的项目曾遇到诸多困难,包括服务器供电不足、配置错误和预算紧张等。

大型数据中心大多有先进的设备来监控数据中心的物理状况,但是许多比较小的公司其服务器机房并不是处在适当的温度或湿度范围,或者没有做到应有的干净。TERiX计算机服务公司的营销专员Joe Guenther指出:“系统在过热、过湿、灰尘过多的环境下也许仍可以运行,但是它们绝对达不到应有的使用寿命,而且较之于在建议的环境状况下运行,更容易受到环境条件的影响,因而频出故障。”

咨询师David Linthicum说,在实施混合云架构上很多企业之前都会犯的一个错误是从OpenStack开始。 IT企业使用开源云软件平台来构建私有云,它提供了类似公有云的功能,但是使用的是内部架构。这么做很合理,但很多企业并没有真正理解他们会面临的问题。

保证复杂的整合项目能按时按预算地进行,同时避免灾难,这并非易事。Joe Latrell认为,一个项目做下来犯几个错误是免不了的。不过,他提醒,项目可能会出问题,得有所防备。同时,全面规划和向别人学习可以避免犯重大和明显的错误。

污染控制服务公司的数据中心服务部门经理Mark Gonsalves表示,数据中心应该排好每季度清洁一次的时间表,地板下面每年至少要打扫一次。他说:“环境越清洁,数据中心运行起来越顺畅。”他补充说,确保环境清洁意味着,没必要更换成本高昂的设备。他表示,要是你的数据中心环境特别脏,一些硬件制造商会宣布硬件保修无效。

“他们采取的方案会遇到很多工程难题,因此最终不是超支,就是很快便放弃了,”Linthicum说。

Joe Latrell是...

积极主动 防患于未然

对于很多企业而言,问题在于他们过于相信私有云的魔力——它可靠且易实现,是公有云的替代方案,Linthicum说,

澳门新濠3559,如果采用预防性维护和合适的监控软件,就可以避免或减少另外的许多服务器问题。SEI服务公司的产品支持经理Chad Peters说:“你可以在问题还没有出现之前及早发现。”

“咨询师们都知道,”部署私有云的复杂度,“外部的确没有很好地沟通”,他说。

预防性维护主要包括三项工作:仔细检查错误日志,查找固件或软件的更新版,以及跑到机房去检查。Peters表示,他公司对错误日志每年检查一两次。他解释:“我们有没有哪个硬盘开始将错误记入日志?我们有没有哪只风扇的转速没有达到应有的水平?我们有没有哪块光纤网卡开始出现一些问题,一些错误被记入了日志?如果有的话,那么我们就能积极主动地更换,以免相应部件出现故障。”

成为业务部门可靠的合作伙伴

你在检查错误日志时,正好也可以趁此机会,重新检查一下服务器上的固件和软件,确保没有漏掉任何重要的更新版。TERiX公司的销售和营销专员Larry Quinn说:“要清楚地了解你有什么样的系统,在上面运行的操作系统使用什么样的补丁版本。如果你在资产和补丁管理方面偷工减料,短期来看节省了费用,但是保证会增加长期费用。”

如今,更好地理解了技术,并且拥有了更好的工具,企业在实施混合云架构时不会那么容易犯致命错误了;但是每当新产品出现时,市场上的噪音对企业会产生负面影响,咨询公司Hurwitz & Associates的董事长Judith Hurwitz说。

预防性维护还应该包括跑到数据中心去检查,确保所有线缆连接到位,确保空气流动管理设备仍然在原位,确保机房保持应有的清洁程度。

使用软件即服务。当SaaS应用首次面世时,业界热闹非凡,各大企业欣喜若狂。他们能够在数秒内下载一个应用并且运行起来——而无需理会IT的繁文缛节。这样非常便利,直到每个部门都有30个SaaS应用时,IT被叫来清理现场。

在下一次计划的预防性维护到来之前,你应该使用监控解决方案,以便服务器开始出现问题时,你能够第一时间收到警报。现在市面上有种类繁多的复杂性和价格不一的解决方案,所以你需要做一番比较,找到最适合自己需要的那款解决方案。

“这样的场景在每一代技术的更迭中都会发生,无论是客户端-服务器或者各种计算浪潮里,大家都想自己完成想要的东西,因为等待IT处理太让人烦躁了,”Hurwitz说,指的是新企业技术的仓促忙乱的引入。

制定灾难恢复支持计划

没有计划,没有底层架构,同时没有管理众多web应用的管控框架,这些只是很多IT部门困扰的开始,Hurwitz说。

最后要记住:问题难免会发生。如果你制定了一项灾难恢复计划,并且对员工进行相应的培训,知道何时联系支持人员、如何联系,就有助于缩短任何服务器故障所引起的停运时间。

不能头痛医头脚痛医脚,IT部门需要学习如何预防问题的发生:和业务部门一起,倾听用户的需求。

TERiX公司的营销专员Christiana Johnson说:“确保寻求支持的途径对于每一个IT员工来说都很容易。这可能包括,备一份时常更新的打印下来的所有维护合同和联系人号码以防你的维护问题包括停电故障或灾难管理事件),明确指示要是哪一个平台、品牌名或原始设备制造商OEM)产品出现故障,应该找哪个有关方或联系人。”无论你的支持直接来自OEM厂商还是来自第三方,都要立马联系对方,这有助于你尽快让服务器重新恢复运行。

“因此不是IT说不。IT部门应该说,‘我们有专家,有经验,让我们一起来让这个变成现实’,”她说。

...

和技术供应商积极合作

Hurwitz的所说的部门间的结盟也是另外一种IT错误。IBM工程师Rajesh Jaluka曾经负责管理一家大型医院系统的IT项目 -- 项目原因不方面透露医院的名字 -- 中央IT部门没有开发任何关于下属医院之间如何完成工作的技术标准。

“他们的确期望我们,作为引入技术的外部开发团队,来驱动标准,因此他们并没有积极参与其中,”Jaluka说。

缺乏参与是致命的。Jaluka说他的IT团队负责的中央数据库的其中一个和自动化绑定了 ——并且接入了病人监控系统。自动化是由“事件”触发的,比如数据库更新。但是没有任何文档记录了是什么触发自动化。错误的消息甚至可能会重启机器。

“如果做错了什么,那么就会影响到病人,甚至可能带来生命危险,”他说。

标准也是Pamela Wise-Martinez的头等大事,她是保护养老金的政府机构的首席云和企业数据架构师。她认为拥有坚实的企业架构— 展现需求和业务部门以及IT部门期望的蓝图—在任何IT项目交付之前是最重要的,无论是像部署混合云架构这么复杂且大规模的事情,还是仅仅需要优化一条业务流程。

“如果没有企业架构师参与,那么就不可能理解如何会影响到企业的其他部门,”她说。

美国政府也遇到过类似的问题。在二十世纪早期,当引入面向服务架构来在机构之间共享并提供数据时,就遇到了类似的困难。

“我们只是在这个领域没有足够的知识和培训,因此联邦政府发现要达到目的非常困难,”Wise-Martinez说。

探索未知世界

在实施混合云架构时没有足够的知识储备,会导致一系列的后果。Linthicum说欧洲企业通常会犯的一个错误是将财务数据迁移到公有云上,因此这些数据会挪动到国家之外,这是违反欧盟数据保护法的。

“他们选用了某个系统,并迁移过去的时候,实际上完全没有理解为什么要这么做,”Linthicum说,“这些他们只能在监管部门发现之前尽快悄悄地挪回来。”

但是IT领域的错误也有其自身价值。Hurwitz引用了90年代的客户端-服务器计算模型。

“我杜撰了一个词,称之为‘胖客户端综合征’,”她说。“将这么多的逻辑和数据放置到每个客户端并最终让其不堪重负。”

错误的根源也很简单:技术还没发展成熟。但是这一失败中却推进了分布式计算步,让业务用户比之前任何时候更为强大。

“如果不犯错,那么就会永远停滞不前,”Hurwitz说。“因此我认为这是科技世界必经的创造性破坏阶段。”

原文链接:

【编辑推荐】

编辑:服务器运维 本文来源:IT企业使用开源云软件平台来构建私有云,保证复

关键词: