原创
作者:陈峻 2017-09-07 15:55:14
安全
应用安全
云计算 ITIL的“前半生”已为我们的企业IT服务治理带来了不少的红利,如今的云服务时代,它是和权游一样面临着“Winter is coming”呢?还是能继续“春风十里”呢?
创新互联2013年开创至今,是专业互联网技术服务公司,拥有项目成都网站设计、成都网站制作网站策划,项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命,1280元新津县做网站,已为上家服务,为新津县各地企业和个人服务,联系电话:18980820575
【51CTO.com原创稿件】长期以来,我们着眼于IT基础设施,硬件设备和软件应用的运维;并且一直践行着用ITIL这样的框架来优化和治理所提供的各种服务。但是随着我们的企业开始将业务向云端进行拓展、部署或是迁移,咱们许多IT运维管理人员的工作职责与内容也发生了潜移默化的变化。
无论面对的是私有云的系统、公有云的服务还是混合云的架构,我们从基础细节提升到了管理迭代的层面上。伴随着这种工作内容上的level up,爱思考的您是否考虑过一个问题:ITIL的“前半生”已为我们的企业IT服务治理带来了不少的红利,如今的云服务时代,它是和权游一样面临着“Winter is coming”呢?还是能继续“春风十里”呢?它对于企业各种云业务的管理是否还适用呢?答案这里先不给出,且让我慢慢用ITIL v3的管理概念来试着和给大家探讨一下对于企业云服务的治理吧。
大家都知道云服务吸引企业的地方在于:按需分配、快速发布、弹性伸缩、和资源池化。而我们常用的ITIL v3所涉及到的服务生命周期则包括:服务设计、服务转换、服务运营、服务改进。细心的小伙伴一定会问:那么“服务策略”呢?这个策略嘛,比较高端,讲真,我们做运维的参与的机会并不多,所以在此暂且不表。因此,我们不难发现云服务和ITIL的各自四个特点是隐约存在着一定对应关系的。
服务设计vs.按需分配
在这个层面上,我觉得和以前内部IT系统的管理流量并没有太大的不同之处,我们更应该注重从业务和产品需求出发,对于任何要迁移到云端或是新增的云业务都须做好服务编录设计、级别配比、和安全预设的工作。
1. 编录设计
首先要做好产品和服务的分类与编录。比如说,在典型的应用场景中,企业所可能采用的云服务功能领域包括:生产环境云、开发测试资源云、内训教学云、桌面云、以及运维资源云等。在每一种云服务里,我们可以根据数据和服务类型进行细化,根据各个应用和不同系统之间的数据流向,勾勒出流转的图表,清晰地定义出何种类型的数据将会在逻辑上或物理上存储在何处,它们是如何在组织/系统间进行流动,以及它们会受到何种方式的管理和保护等。当然,由于云业务突破了地域上的局限性,我们也要适当地对数据的存储和可能在迁移时所涉及到的当地相关法律及监管要求予以研究和说明。
2. 级别配比
随着企业云业务的深入,我们以往对于用户和客户的服务承诺与品质保障被逐渐地从日常工作中剥离,进而部分转移到了云服务商那里。在大多数企业的实践中,IT部门降低了以往运维工作的比重,而会花更多的时间从RTO和RPO出发,去评估包括基础网络带宽、高可用性、并发数、响应时间、存储频率和备份深度等指标。
他们通过与云服务商进行协商和约定,进而界定出那些本企业与服务商之间,以及各个服务商之间的易重叠或不清晰部分,以免出现“踢皮球”的情况。这对IT部门来说既是原有服务级别的保持与延续,又能保证合理的服务资源的分配,同时还为我们马上要提到的安全预设做好了基本准备。
3. 安全
曾经有不止一个运维部门的小伙伴向我抱怨:“一入云端深似海,从此安全是路人”。那么到底有多深呢?让我们具体从如下不同的角度来分析一下吧。
首先是在物理上,可分两部分:
其次是在逻辑上,其“任督二脉”是:相对动态的数据和相对静态的应用。
(1) 在一般云业务中,数据仍旧遵循着“创建->存储->使用->共享->传送->归档->销毁”的生命周期轨迹,所以我们应当:
(2) 而对于云应用方面的安全,我们可以采取身份和访问管理(IAM),在确保各种来自AD、LDAP或其他SaaS服务商的用户账号信息能够在内部同步的前提条件下,利用SAML、XACML或Oauth来基于角色和权限的映射矩阵,保证用户仅能看到他们有权访问的数据。
可见,对于IaaS模式的业务来说,由于从系统层面上为我们所掌控,因此完全可以利用各种工具和手段,给系统做“大保养”,来保证各类云资产和服务的安全。而SaaS则相反,由于我们能够访问和掌握的信息源数量最少,因此其安全责任主要是服务商所承担,而约束性合同则是我们的唯一抓手。
二、服务转换vs. 快速发布
云业务的弹性灵活和快速转换的特点虽然是那么的“金光闪闪的”,但是也给我们运维团队带来了配置和变更上的复杂性。以往,我们一旦在系统的初期完成了配置与部署,就能够管上一段时间。而变更更是能怼就怼回去,实在顶不住也要通过规范的流程来谨慎行事。而现在呢?由于“试错”的成本降低了,各种“花式”的变更需求已经成为了家常便饭,配套的配置信息也像松鼠屯粮一般妥妥地上涨。
1. 配置
我们在过往的廉环话里有讨论过有关配置管理方面的各种实践。这里,我们着重来聊一聊和云服务有关的配置方面的问题。对于企业内部桌面云的配套设备而言,虽然很多已经做到了OOTB(开箱即用),但是一些例行的升级和资产的录入与统计,还是需要我们IT人员去持续跟进的。因此我们仍然有必要本着“做一看二想三”的宗旨,搭建和维护好一个配置管理数据库。该CMDB除了能够根据后期实际需求进行各种表项和字段的扩充以外,还应当使得保存在其中的各种配置基线具有可移植性,以方便根据不同的云服务应用场景进行灵活组合和快速成型。
2. 变更
3. 测试
4. 发布
三、服务运营vs. 资源池化
1. 容量/资源池
清晰的容量和性能需求对于云服务的空间与资源的预估和购买是相当重要的,同时也能够在云业务的上线之初和交付之后的一段时间内,有效地杜绝潜在的中断和性能瓶颈。当然,我们也应该与云服务商事先制定好按需订阅或扩容条款。如果购置的是IaaS的话,我们则可以在实际需求或业务模式发生变化时,及时地根据CMDB里的模板产生新出的虚拟机、动态地增配CPU和内存的数量、以及临时将某个host迁移到他处等。
2. 高可用性/连续性
凭借着虚拟化主机和网络设备的镜像和数量的优势,我们的云业务可以充分发挥其服务的自愈和扩展能力,从而实现HA、业务连续性、和灾难恢复的效率。我们平时的各种重复单调的维护工作量也能相应地大幅减少。当然,对于那些和我们的系统有关,但由云服务商所负责的部分,我们不能只是被动地接受其例行的测试成功报告,而应当主动要求,真正地参到测试环节之中。
3. 事件/故障响应
在云业务环境中,由于突破了以往的一套系统仅能提供单一服务的限制,所以造成了应用种类、数据混杂、和设备资源相互交错的状态。我们所面对的早就不再是能否扑捉截取到事件发生的问题了,而是各种被自动采集的海量事件集中性地扑面而来,所导致的筛选、分析和去除误报的局面。
具体来说,对于采用SaaS模式的企业,可能会更多地需要依赖云服务商的来采取各种的应急响应措施。而对于使用IaaS的企业,其IT部门则有能力和责任按照我们在《安全事件响应之五步进阶》里提到的“识别和分类->调查和取证->抑制、根除和恢复”的流程进行应对。我们逆推着来看:
可见,我们需要建立的是一套更全面和有互动性的日常管理流程,而非针对某个产品或项目的特定应对模式。与此同时,我们可以采用当前比较流行的大数据分析的一些工具,在实现快速综合性的智能分析的前提下,获取本企业不同应用中的云业务的全网视图,综合分析各种安全状况、安全事件和安全趋势,做到防范于未然。
四、持续改进vs. 弹性伸缩
1. 持续监控
对于我们一般的企业而言,IT运维部门做好对既有云业务的监控与管理是很有必要的。监控的重点应当放在三个方面:
记住:监控只是手段,不是目的。其真正目的就是要能够实时了解到使用的需求、消费状况、和安全的态势,通过对现有云服务资源的弹性调整,从而改变以往对物理资源的死板预分配和对网络带宽的滞后的模式,形成正反馈。
2. 动态调整
技术和设施都在不断迭代和进步,因此我们可能会从整体性能以及运营成本等多方面考虑是否需要对运行了一段时间的云业务进行整体或部分的迁移。迁移的前提条件是:要保证前后服务商所提供的云服务产品的互操作性和延续性。就像以往能够在不同的硬件设备环境中部署系统那样,我们要求企业云业务的各种组件也能够被来自不同服务商的环境所替换,平滑地部署应用,并能交换导出/导入,从而最终实现无缝迁移和持续运营。
有过运维经验的小伙伴应该知道,从迁移的难度上说,SaaS>PaaS>IaaS。而可能碰到的问题会包括:旧云平台所用到的API、数据格式、标准和支持文档、业务的定制部分的旧平台依赖性和新平台的不兼容性、以及业务的起/停顺序和导致的中断等问题。因此,我们运维人员需要提前理解和做好数据备份、新应用的部署、以及切换顺序和详尽的回滚方案。同时在迁移结束、配置信息调整以及测试完成之后,我们不可马上与旧的云服务平台拗断,因为很可能需要让新旧云业务并行地运行一段时间。
3. 服务商管理
前面我们屡次提到如何与云服务商进行各种协作。但是由于他们不再会来到我们的机房或办公区,我们也不大可能常去他们的云服务机房,而且其提供的云服务也不再显而易见,那么我们最终如何考量他们的服务级别的达标情况呢?我们根据实践经验发现:只能通过设定好的报告模板和内容项的格式,并审计和汇总其呈交的各类报告,来实现远程地协调与管理,从而在整体上改善和提高其服务的“信价比”。当然,我们也可以将各个服务商予以“池化”,营造良性竞争的环境,对于无法通过自身改进来提升服务种类和质量的服务商,就只能让他去领便当了。
总的说来,在您的云业务中,如果云服务商所提供的“XX即服务”占比越多,您在治理控制方面的灵活性就越弱,他们的责任就越大;相反,倘若他们的占比越少,您的管控能力则越强,相应的负责也就越大。因此,大家依据服务合同,不应该“互相伤害”而是要“愉快地玩耍”。
小结
上面和大家聊了不少ITIL在云治理中的运用和实践。可见ITIL的服务管理“套路”还是能够在企业新的云应用场景中保持老当益壮,焕发第二春的。而作为IT运维的我们,工作内容已经从原来的单纯技术,滋长成了“技术+管理+业务”。
有经验的小伙伴也许有这样的体会,根据各个企业的实际规模、需求状况,以及云业务实现程度的不同,各类IT管理与运维人员也有着细微的专注点。比如说:基础日常运维人员会更关注于IaaS,项目、部署人员则更关注于PaaS,而业务支持人员可能主要关注的是SaaS。但是,无论您在企业中是什么角色,关注哪一方面的云服务,我都希望您能够运用ITIL这把“洛阳铲”继续深耕云业务,解锁出了更多的运维和管理的新技能。
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】
网站标题:【廉环话】ITIL老矣,能治“云”否?
文章位置:http://www.mswzjz.cn/qtweb/news19/505269.html
攀枝花网站建设、攀枝花网站运维推广公司-贝锐智能,是专注品牌与效果的网络营销公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 贝锐智能