APP下载

基于Oracle数据库的气象业务系统运维管理研究

2017-09-29郭晓佳江彩英谢丹

软件导刊 2017年9期

郭晓佳 江彩英 谢丹

摘 要:南平市气象局有乡镇气象信息服务站、防灾减灾气象移动指挥平台、县市预报服务平台、微信、微博等平台应用Oracle数据库。随着气象业务不断扩展,需要保存的数据量不断增长,对气象业务平台尤其是数据库系统运维管理提出了更高要求。气象Oracle数据库的正常运行对确保气象业务的正常开展具有重要意义。加强气象业务平台Oracle数据库运行维护管理,对指导气象业务平台与支撑数据库平稳可靠运行具有参考意义。

关键词:气象业务系统;Oracle数据库;CMACAST系统;数据库性能

DOI:10.11907/rjdk.171610

中图分类号:TP319 文献标识码:A 文章编号:1672-7800(2017)009-0145-03

Abstract:At present large Oracle database system has been deeply used in various business, nanping meteorological administration weather the normal operation of the Oracle database to ensure the normal conduct of zhuhai meteorological operations has the vital significance. This article provide meteorological operations platform support Oracle database maintenance of the key points in the process of operation, to guide the various meteorological business platform and stable and reliable operation support database has reference significance.

Key Words:meteorological operational system; ORACLE database;CMACAST system;database performance

1 氣象数据库系统维护

1.1 数据库系统运行环境维护

气象数据库管理人员在安装数据库前必须做好系统安全维护的基础工作,一是构建一个安全的内网网络环境,二是运用操作系统的策略配置维护业务系统运行的基础环境。

网络上每一台计算机的安全状况、网络安全设备策略配置参数以及管理人员日常的细心维护,都关系到整个内网网络环境安全。网络上任何一台计算机的安全漏洞都是整个内网安全的短板。所以,保证网络中每台计算机的安全是安全网络环境的第一步。市级气象局在各网络边界通过布设网闸、防火墙等安全设备,完全隔离了内网和外网的所有通信协议连接,可有效防止外网入侵攻击;管理人员必须时常关注网络运行情况,及时将多种安全产品无缝结合并升级,维护好网络安全产品。

气象业务系统使用的Oracle数据库安装在Windows操作系统下,首先,应及时升级Windows各种补丁程序,规避可能的系统错误和风险,保证Oracle数据库系统的正常运行。其次,要加强操作系统帐号和密码的维护和管理,密码设置和帐号管理要符合安全性要求。第三,在操作系统上必须关闭不必要的服务和端口。第四,管理人员要查看系统日志,检查错误发生的原因,寻找攻击者留下的痕迹。

1.2 Oracle数据库系统安装与运行维护

Windows下Oracle系统安装应注意事项:①Oracle安装文件所在路径以及安装路径不要有中文或空格;②..\\product\\11.2.0\\dbhome_5\\NETWORK\\ADMIN\目录下tnsnames.ora和listener.ora文件HOST=后地址要一致,否则在安装完成后可正常使用的EnterPrise Manager Console (Oracle企业管理器)在机器重启后无法正常使用。

安装好Oracle软件后,系统会创建7个服务。在控制面板 “服务”选项中可以看到如下服务: OracleVssWriterORCL、OracleServiceORCL、OracleOraDb11g_homes1TNSListener、OracleOraDb11g_homes1ClrAgent 、OracleMTSRecoverySerice、 OracleJobSchedulerORCL、OracleDBConsoleORCL。其中OracleServiceORCL是Oracle的核心服务[1],只有该服务启动Oracle才可正常启动。目前开发程序和数据库管理要使用PL\\SQL Developer Enterprise 和Manager(企业管理器OEM), 因此OracleOraDb11g_homes1TNSListene和OracleDBConsoleORCL两个服务也必须开启。

1.3 运行环境与数据库应急备份

为防止后台数据库崩溃影响气象业务平台的正常运行,可安装一台服务器用于数据库的冗余备份。备份服务器操作系统及相关配置与主用服务器一样,然后在其上配置一组相同数据库。当主用数据库服务器发生故障时,将业务平台数据库的链接配置指向备份服务器即可。在安装备份数据库时可采用“导入导出”方法,步骤如下:①在备份机上安装与主用数据库相同的Oracle版本,建立好相同的用户名与密码;②将主用机上的库表导出。打开电脑cmd命令窗口,输入以下命令:exp 数据库名/数据库密码@连接实例名(一般为orcl) owner=数据库用户 file=导出路径和命名。将生成的dmp文件拷入备用机,在备用机上将库表导入。打开电脑cmd命令窗口,输入以下命令: imp数据库名/数据库密码@连接实例名(一般为orcl) file=备份文件目录 full=y。备用机安装配置好后,采用与主用机软件同步数据方式即可完成数据库的冗余热备。endprint

1.4 气象Oracle数据库日常维护内容

1.4.1 Oracle数据库数据来源维护

气象业务平台数据来源有4个部分:①CMACast系统。CMACAST是目前气象部门正在使用的卫星接收系统[2],其接收的资料是预报员进行天气分析及本地业务平台的数据来源;②自动观测气象站。目前南平市建有200余个自动气象观测站,市局中心站接收来自户外自动气象站观测数据;③省局共享服务器数据。这些数据由省局推送到市局数据服务器,主要是全省各地的雷达数据和其它地市自动站数据;④预报人员天气分析得出的预报结论、预警信息等电子文档。

气象数据库管理人员首先需要做好数据源系统维护,确保入库原始数据的完整与准确[3]。

1.4.2 气象数据库维护工作

管理人员要对气象业务平台使用的Oracle数据库进行维护,主要维护内容有日志文件清理、数据库性能检测、数据库安全检查等。

(1)Oracle数据库日志文件清理 。数据库管理人员需要对Oracle数据库运行中日志文件进行清理。删除的文件主要有Oracle 系统产生的日志文件,包括监听日志listener.log、跟踪日志adump、bdump、udump,以及归档日志、无用的备份等。

listener.log是Oracle的监听日志[4],在文件中记录了数据库实例注册操作、客户的连接等日志。监听日志可帮助管理员诊断数据库问题,如果监听日志过大可能会引起故障或性能上的问题。清理方法如下:输入命令lsnrctl进入交互模式,关闭监听日志LSNRCTL>set log_status off,删除listener.log,打开监听日志LSNRCTL>set log_status on。

Oracle数据库上打开了trace on功能,会产生跟踪日志文件,这些文件放在bdump、cdump、udump目录下。其中bdump用来存储Oracle后台进程生成的输出文件,cdump用于存储内核进程生成的输出文件,udump用于存储用户生成的输出文件。命名为orcl_*.trc的可以删除,而alert_orcl.log是不能删除的。

Oracle数据库归档日志一般位于\\flash_recovery_area\\ORCL\\ARCHIVELOG目录下,以日期为名的文件夹存放,删除时仅保留最近几天日志用于数据库恢复,但在controlfile中的ARCHIVELOG信息需要利用RMAN进行彻底删除。

(2)Oracle数据库自带的OEM工具对数据库进行控制和管理。Oracle数据库自带的OEM(Oracle Enterprise Manager, Oracle企业管理器)可便捷进行数据库控制和管理[5],其直观而方便的图形化界面GUI,可帮助管理人员完成数据库对象、用户权限、数据文件、定时任务管理、参数配置、备份与恢复、性能检查与调优等操作。使用方法:打开浏览器,输入https://localhost:端口(默认为1158)/em/console/logon/logon,在弹出的登陆页面中输入用户名:SYS及密码,连接身份选择“SYSDBA”进入Web管理工具。在数据库实例下有7个选项卡,分别为主目录、性能、可用性、服务器、方案、数据移动、软件和支持。其中“主目录”选项下可以查看数据库状态、实例名、开始运行时间、当前CPU使用情况、活动会话数据、SQL响应时间、诊断概要、空间概要、预警等信息。

OEM可帮助管理人员对数据库故障进行定位。例如:管理人员在某日巡视时发现“主目录”选项下CPU使用率高,在“性能”选项下可查看一段时间内的TOP事务,点击“顶级活动”,在弹出的顶级活动图表下点击“SQL ID”可以查看SQL详情,可通过分析sql语句进行相应的调整优化。

AWR与ASH报告也是管理人员进行数据库性能分析的工具,它能帮助数据库管理人员全面掌握数据库性能、分析数据库故障。AWR(Automatic Workload Repository)自动工作负载信息库[6]是Oracle 10 及以上版本提供的一种性能收集和分析工具,它采集与DB性能相关的统计数据,数据库各方面性能(包括硬件、软件、应用、数据库)情况;ASH(Acitve Session History)是一个会话级别的性能诊断报告,可作为AWR的补充。OEM提供的便捷工具可生成AWR与ASH分析报告。在“服务器”选项的“统计信息管理”下,AWR基线点选名称“SYSTEM_MOVING_WINDOW”下“报告”,可生成“基线SYSTEM_MOVING_WINDOW AWR报告”。在“性能”选项下可通过“运行ASH报告”指定报告时间段与过滤器,生成ASH报告。

2 常见故障及处理方法

气象业务系统及其支撑数据库经常会出现一些问题,理清并熟悉故障处理思路对提高系统维护效率有着重要意义。常见故障及处理方法如下:

(1)当出现气象业务系统显示数据不全或提示某类产品缺失时,管理人员应追溯检查数据来源,保证入库原始数据正常准确。

(2)当数据库服务与气象应用服务器连接不正常时,管理人员应首先检查网络连接,在确认机器网卡与网络连接设备正常情况下,可通过重启数据库服务器或应用服务器来恢复。这类故障主要由于系统错误或服务被挂起,将机器重启故障一般可排除。

(3)当数据库系统被病毒破坏时,管理人员应及时使用杀毒软件或电脑病毒专杀工具进行处理。如果仍无法解决,可应急启用备份数据库,将业务平台数据库链接指向备份数据库,重装数据库服务器操作系统来恢复。

(4)当业务系统空间达到极限报错时,管理人员需要检查日志文件、临时文件和临时表空间,删除大的临时数据库表文件或access.log文件。

(5)当数据库管理人员误删表空间、数据文件或用户时,数据字典中关于表空间信息都会被删除,唯一的方法是从备份中恢复。

(6)当数据库管理人员在使用 imp命令在备份机上恢复dmp数据时,如果出现系统提示字符集错误,就是在数据库表中存储了中文,存储过程使用了中文编码。这时需要将备份机上数据库字符集、客户端字符集、新配置的环境值改成dmp文件一样的字符集。

3 结语

气象Oracle数据库的平稳正常运维非常重要,管理人员在全面掌握業务数据流程的同时必须加强对气象Oracle数据库的管理和维护。要经常对数据库作备份,且备份的内容一定要作恢复性验证[7]。数据库系统出错或管理人员误操作后一定要保留现场,寻求软件开发公司的技术支持。

参考文献:

[1] 付国辉.企业级ORACLE数据库的性能优化研究探讨[D].长春:吉林大学,2013.

[2] 王春芳,李湘,陈永涛,等.中国气象局卫星广播系统(CMACast)设计[J].应用气象学报,2012(1):113-120.

[3] 郭晓佳,江彩英,谢丹,等.气象业务服务器管理与维护[J].软件导刊,2016 (12):101-103.

[4] 李勋章.网络日志监控及安全审计系统的设计与实现[D].成都:电子科技大学,2012.

[5] 陈春松.使用OEM 10g Grid Control进行Oracle数据库环境集中管理[J].计算机系统应用,2010(3):217-220.

[6] 张文峰,彭小斌,林根深.AWR技术在ORACLE自动管理中的应用[J].中国数字医学,2014(8):114-115.

[7] 方剑锋.灾难备份技术的应用研究与实现[D].上海:华东师范大学,2009.

(责任编辑:杜能钢)endprint