工程师计划 项目管理 项目实施中应该注意的事项

项目实施中应该注意的事项

1. 项目实施中应该注意的事项

《构建高可用Linux服务器》第1章Linux服务器构建基础,本章从Centos5.5 x86_64的安装、网络配置、日志分析、性能及状态监控、优化及虚拟化等方面对Linux硬件进行了全方位的说明,这些都是构建高性能及高可用Linux系统的基础,希望大家能够掌握此章内容。本节为大家介绍项目实施中应该注意的事项。

2. 项目实施中应该注意的事项

项目施工工程师可能会实施不少公司外包的项目,像并发量大的CDN广告网站,还有证券类资讯网站,以及电子商务网站等,还有就是一些并发量不多的Linux集群广告网站等。个人感觉其实在项目实施的过程中还是有很多技巧和心得的,而且项目实践的锻炼也会让人成长得很快。下面将介绍一下在项目实施过程中我们应该注意哪些事项,希望能引起大家(尤其是项目实施工程师们)的重视。

1)准备工作一定要做好做细。项目实施属于比较有技术含量的工作,有时还会因为合同期限会对时间有限制,所以一定要在公司将所要部署的施工方案细化,最好是做个几十遍,将各种各样的意外都设想进去。众所周知,Linux下的软件如果是源码编译安装的话,有的也区分32位和64位,更别说Windows下的程序了。在吃了一次亏后,我就直接建议,以后程序的开发环境和测试都统一为64位,部署环境则都统一为64位的Centos5.x及Windows 2003企业版+SQL Server 2008。这说的是服务器操作系统的统一性。再说一下软件版本的问题,比如说我们要用Nginx作负载均衡,这时候是用Nginx 0.7x还是Nginx 0.8.15呢?经过大量测试,包括相关的压力测试,最后决定用Nginx 0.8.15,因为其稳定性相当不错。所以后来的项目实施中一直采用Nginx 0.8.15,其他的软件版本也会进行类似测试,测试的工作一定要做好做细多做,虽然可能会占用不少时间和精力,但这项工作是必需的。另外就是要跟客户的IT技术部门多沟通,弄清楚他们的机房带宽,服务器是放在自己机房还是放在电信机房,值班人员是否24小时监控,服务器的性能如何,是否是四核至强,单台大约能承受多少并发量(很遗憾,这个问题基本没多少IT技术人员能够很清楚),最好的做法是给对方的IT技术人员一张关于网络和系统的调查表,然后一定要得到对方肯定的反馈。我最喜欢的情况之一是对方什么都没有,从路由器到服务器到存储都是由我们推荐,由他们购买,这种情况就能对服务器的性能一清二楚了。根据我所了解的情况,系统管理员一般都很熟悉Windows系列,但一谈到Linux和Unix,尤其是Centos和 FreeBSD,基本就不太明白了,所以一定要耐心跟他们核对。另外有一件事需要提醒大家,我们带过去的程序,如果是Linux的源码和数据库文件的话估计还好,但如果是Windows文件,尤其是可执行文件(一般是用移动硬盘直接携带),一定要用最新的杀毒软件杀毒,我们一般用NOD32和卡巴斯基,但这还不保险,最好是跟对方的技术支持人员多沟通,用对方的杀毒软件来进行检查。在这一点上我们是有教训的,如果你的软件有病毒,损失会全由你方来承担,而且这对于系统管理员来说就太不专业了。我负责的多是Linux/Unix机器(我安装的MySQL机器也很多),所以我这里基本没出过类似问题;而同事携带的移动硬盘,由于用过的人太多,结果拿到客户的机房一扫描,居然发现有病毒。所以这事最好是在己方公司做好,不要因为细节影响大局。另外要多了解一下对方是否有网络安全方面的防火墙,一定要有一台防DDoS攻击的。目前我们的客户多是做证券系统和电子商务的,非常注意安全,一般都有Juniper系列的防火墙。

2)在项目实施过程一定要注意多部门的沟通和配合。这一点其实也很重要,一套系统里一般包含着程序、数据、图片等文件,所以作为项目实施人员,平时一定要注意与各部门多沟通多了解,必要的时候可以跟开发人员一起工作和探讨问题。其实作为系统工程师,即System Admin,你可以不精通但一定要懂这些语言,比如PHP、Java、C++等。另外跟数据部门也要多注意交流,了解数据库是运行在什么平台下的,是MySQL还是SQL Server 2008,这样才能有的放矢、胸有成竹。公司内部的交流基本还算比较顺利的,难点就在于项目施工过程中的多部门协调和交流。我们会提前跟客户的业务领导打招呼,约定在一个时间段将所有的施工人员召集起来开一个交流会。比方说,我们要在南京做某证券系统,我们从武汉出发,3小时的动车到南京。下了火车后直接去客户的办公室,拿出了项目的施工拓扑图,迅速地跟所有的施工人员开了一个会,说明了项目施工中的重点和困难。虽然这样做确实很辛苦很累,但这事最好提前做,并且要迅速,谁都不知道在项目实施过程中会出现什么样的意外。第二天我们去电信机房时,发现HP的工作人员一下子来了6位,刚开始我不是特别理解,后来明白了,原因就是4U的服务器确实长得“很彪悍”,人少了动不了它。还好HP想得比较周到,派的都是年轻力壮的小伙。那个项目属于中等项目,一共有6位HP的工程师,华赛派了一位网络工程师,天泰派了一位安全工程师,我们的客户是派了3个IT技术支持过来,我们这边则是我和同事两人。人多力量大,各司其职,迅速做事,效率还是很高的。HP用KVM安装系统,8台服务器同时安装。另外的两位工程师也很迅速地设定IP,做内网IP映射等。最后,我担心的意外都没发生,一天之内将所有服务器的系统都正常安装了,同时开放了Linux的远程(SSH:22)和Windows的远程(我们是用Remote Admin),网络方面也基本畅通。天泰的安全工程师调试了一天,就开启了防火墙的透明(Transparent模式)。这是比较成功的案例,失败的例子我也经常遇到,比如网络不通或对方将我们的网络设置错误等,那就比较折磨人了,希望大家在实施时注意。

3)迅速和稳定地处理项目实施中遇到的突发事件。这一点就看项目实施人员的经验和能力了。比如我有次去武汉某证券公司部署Nginx+Apache的“1+3”的小型网站时,忽然发现有台HP360的主板坏了,怎么也装不上系统。我只好放弃这台,只部署了“1+2”的方案,保证整台系统还是按约定的时间上线。然后我又跟公司的Qs做了大量的压力测试,发现“1+2”的方案能顶上,所以就暂定用它了。还有一次,我们去实施时,发现客户已请了家外包公司将机房的网络做好了。由于客户要求做HA系统,所以我们在施工拓扑图上多画了一个网段,即10.0.0.0网段,然而客户这边的IT老总将意图理解错了,居然将整套系统做成了两个网段,还划分了VLAN。原本只是局域网中的一套系统,怎么搞得这么复杂啊?没办法,只好花了一下午的时间跟他解释什么叫Heartbeat,什么叫双绞线。等他明白过来,再让外包公司的人过来重新布线和分配交换机的IP时,宝贵的工期已足足过了3天。这3天我只能先将系统和能部署的全部署上去,最后只等网络ping通了。期间也想过增加一条静态路由的方法,但对方的网络工程师不停地做抽插网线的实验,最后只有作罢。还有一件事,那是替客户将所有系统部署好后,发现80端口怎么也通不了。仔细问了对方的网络工程师,确定问题不是出在对方那里(熟练的网工难道还不会映射一个80端口?),我用远程Telnet对方映射的外网IP 80端口时发现毫无反应,忽然想到:是不是机房封了80?难道这么简单的问题事先没沟通好?立即让对方的老总跟机房备案开通了80端口,问题就解决了。总之,在项目施工中,会不断遇到许多不顺利的事,让你焦头烂额,这就要看你的应变能力了。注意,这时候耐心地跟对方沟通很重要,毕竟人跟人之间需要交流。你要理解的是:你可能是某方面的权威,但在另一方面,你可能什么都不算。所以,低调做人、高调做事,这也是项目施工中应该注意的。

4)在项目施工中多学习,提高个人的能力。实际的线上环境还是很锻炼人的。我个人感觉,一个成熟且安全的系统,还是很有技术含量的。你要了解网络、程序、数据库,还要了解什么叫并发,什么叫SSL(哪家公司支持多域名的SSL),什么叫网架架构。你的网站安全吗?监控怎么办呢?文件服务器压力大吗?单台Web崩溃了怎么办?PHP的Session共享怎么解决?MySQL数据库做成什么样的?是主从复制还是做成MySQL-cluster(个人认为主从复制更适用于线上系统)?你的SQL Server 2008是单台还是做成SQL Server 2008故障转移群集?shell很熟悉了吧,Apache下的正则熟悉吗?能不能在10分钟内搞定?有时候,做系统集成挺累的,你要掌握的东西太多了,而网工相对而言压力就小多了,你只要保证网络通畅即可。不知道大家有没有遇到这种情况,老板经常会站在身后,看着你处理故障,所以如果2分钟能处理的事,我绝对不会拖到第3分钟。没办法,压力逼着人成长。项目实施一般都是有合同时间期限的,所以需要大家在短期内做好部署工作,测试这块可以跟对方商量,对方也要花一段时间进行内测的。完成一个成熟安全的系统后,你会发现自己成长得非常快,平时不太注意的细节在线上就是重大的安全生产问题了。所以只要公司有外出部署的项目,我一般都会参加,毕竟可以有机会接触到各种各样的服务器及小机,还有防火墙等。

5)系统的测试和监控。压力测试和性能测试一般由公司和对方的测试人员进行,这一般都会给比较充分的时间,特别是压力测试这块,需要耐心地和对方的QS沟通,顺便熟悉他们用的Load Runner(这个软件的使用还是很复杂的),或者是Apache自带的ab工具和webbench等。监控这块我强烈建议用Nagios,邮件和短信通知都要做,并要求对方的系统工程师24小时开机,遇到紧急事件要即时处理。事实证明,如果都是做成双机HA,并且有DDoS防火墙的话,紧急事件还是比较少的。

以上是我在项目实施工程中的一些经验和心得,与大家分享一下。记住,技术不能完全左右项目的成功与质量,因为技术只占其中一半的分量,有可能一半还不到。成功实施一个成熟且安全的网站或系统,其中的成就感和酸甜苦辣也只有自己知道,希望大家能从中得到帮助(特别是项目实施人员和系统管理员)。
————————————————
版权声明:本文为CSDN博主「huyangg」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/huyangg/article/details/7165487

本文来自网络,不代表本网站立场,转载请注明出处。http://loadingok.com/1960.html
© 2021 京ICP备2021027871号-1
联系我们

联系我们

18513870113

在线咨询: QQ交谈

邮箱: 1140136143@qq.com

工作时间:周一至周五,9:00-17:30,节假日休息

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部