一、操作系统平台 机智云系统搭建在全球服务器使用最多的Linux操作系统平台上,因为它具有一致公认的更好的稳定性、效率性和安全性。而我们所采用的操作系统是Linux非常成熟的发行版之一CentOS (Community Enterprise Operating System),它是来自于Red Hat Enterprise Linux依照开放源代码规定释出的源代码所编译而成的。以其稳定性、可靠性和安全性而著称,同时有着强大的英文文档与开发社区的支持。 每个版本的CentOS都会获得十年的支持(通过安全更新方式)。新版本CentOS大约每两年发行一次,而每个版本的CentOS 会定期(大概每六个月)更新一次,以便支持新的硬件。所以CentOS是很多商业性公司服务器操作系统首选。 目前我们使用了CentOS 6.3加固版64位操作系统,包含了很多错误修正、升级和新功能。 二、云盾防护系统 云盾防护系统是依托公有云服务系统,通过主动防御和风险提醒方式,分别包含如下方式保障系统安全: DDoS攻击:DDoS(Distributed Denial of Service)是分布式拒绝服务攻击的英文缩写,它是一种利用多台计算机向指定目标服务器发送攻击数据包,导致目标服务器系统资源或带宽耗尽,从而对正常业务请求出现拒绝服务的攻击行为。我们采用业界主流专业DDoS防护设备,能有效抵御SYNFLOOD,UDPFLOOD,CC等常见攻击。当云盾发现攻击时,立即加入保护,无需人工介入。并使用精准的数据分析,系统实时提供流量数据,通过数据分析攻击情况;同时提供攻击类型、攻击流量、攻击时长等数据,便于取证、追溯及分析。 端口安全检测:定期扫描服务器当前开放的端口,降低系统被入侵的风险,并有端口开放列表详细报告。 异地登录提醒:根据网站运维人员的登录习惯进行分析并建立模型,异地登录提醒通过扫描访问日志实时发现异常登录行为,并以短信或邮件的方式通知运维人员,运维人员则可查看用户登录的时间、地点和目标服务器进行确认,避免非授权登录可能造成的损害。 主机密码暴力破解防御:密码暴力破解对服务器的危害很大,如果被破解成功,会窃取管理员权限,从而危害网站及网站用户信息和权益。密码破解防御通过扫描访问日志实时发现非法入侵,并将入侵的IP封禁24小时。并以短信或邮件的方式通知运维人员,让运维人员查看入侵时间、不法IP来源、目标云服务器和拦截的次数等入侵信息。 网站后门检测:网站后门是植入网站的一段代码,运行在Web端,通常隐蔽性较好,管理员较难实时发现,植入后门的网站会被窃取网站信息,甚至丢失网站控制权,同时会侵害网站用户的隐私信息,给网站造成不可挽回的损失。后门检测通过扫描访问URL实时发现网站后门,并以短信或邮件的方式通知运维人员,让运维人员查看网站后门隶属的云服务器及后门URL等信息,以便及时删除后门消除隐患。 网页漏洞检测:提供对网站的SQL注入、XSS跨站脚本等各项高危安全漏洞进行检测,并将检测报告提供给运维人员。 网页挂马检测:通过静态分析技术与虚拟机沙箱检测技术相结合,对网站进行挂马检测,准确率95%以上,并将检测报告提供给运维人员。 三、操作系统的日志文件分析 Linux的日志文件用来记录整个操作系统使用状况。运维人员会专门针对几个重要的日志文件进行关注和分析,如lastlog,secure,maillog等,从而分析得到更为详细的系统使用记录。 记录进入系统的用户的信息,包括登录的时间、登录是否成功,登录帐号的名称,登录的IP地址等信息。 记录在系统上所有的操作,包括操作命令,后台crontab信息, 邮件发送情况,硬件警告信息等等。 四、系统及软件升级更新 操作系统升级。在CentOS官网有升级通知时,我们运维人员会权衡和考虑此升级对系统安全性和稳定性影响如何,及时做出相关策略,保证系统风险降到最低。 软件升级。机智系统除了我们自己开发的系统外,还需要依赖第三应用软件,如OpenSSL,RabbitMQ等等,对于其官方网站有最新版或漏洞补丁时,我们运维人员也会马上做出响应,评估其风险,是否需要更新或升级。 五、系统软硬件状况监控平台 为掌控系统软件及硬件运行状况,必须要有实时监控平台,对预防和发现故障,并及时通知给运维人员,快速响应处理,从而保证应用服务正常持续有效。 对于机智云系统,我们监控了每台服务器硬件运行状况和系统应用程序,涵盖了常用的各种监控类型,如:URL监控、Ping监控、HTTP监控、TCP端口监控、UDP端口监控、DNS监控、SMTP监控、FTP监控、CPU利用率监控、内存利用率监控、磁盘空间利用率监控等等。并将网站或服务器故障问题发送到手机和邮箱上,确保运维人员及时获取故障信息并响应处理。 为了完善和更进一步监控我们应用服务,提高系统稳定性,我们也对某些应用服务进程进行特定监控,如nginx, uwsgi, 以及一些机智云特有的服务等等。 六、系统备份策略 我们对机智云系统有一套数据备份策略,运用自动化脚本对相关重要数据进行备份。确保万一在系统遭到破坏或黑客攻击而发生瘫痪时,能迅速恢复工作,把损失减少到最小。 数据库备份。机智云系统采用了RDS及NoSQL两种类型数据库,自动化脚本定时每天对它们进行增量备份,每周进行全量备份。 系统日志文件。每天应用系统产生大量log日志文件,记录系统服务每个响应请求,及相关操作。自动化脚本每天会对这些log日志文件进行处理保存。方便开发人员及运维人员针对相关问题进行查找定位。 系统镜像备份。机智云系统由许多子系统组成,每个子系统部署在不同的服务器上,以及各自负责不同的功能,同时又相互紧密结合影响。所以我们都分别地对各个子系统进行镜像备份。对快捷恢复系统平台起到至关重要作用。 七、 运维人员监控机制 目前保证机智云系统正在有条不紊地运行,除了实时监控平台外,还有三位运维人员负责监控和维护。 每位运维人员按照制定的时间对系统24小时检查和及时相关故障报警值班。手机务必24小时开机在线状态,2分钟内必须接通电话。假期时间也不例外。 运维人员每天及每周对机智云系统进行作常规检查项目后,需要得出服务器状况检查报告。 如应用系统程序运行状况,系统硬件CPU负载,内存使用率,磁盘空间使用状况等等。
|