100分在线求更新全文索引中oracle老挂掉的问题。

goneaway 2008-08-02 04:56:37

这个数据库是oracle8.2.0.4上的一个数据库。数据总量比较大。实时入库量也比较大。前段时间t_wap_content表（一个有200多G含blob字段的分区表）中blob字段的全文索引损坏了（原因之前夜有提问，但还是没有找到很确切的原因，见 http://topic.csdn.net/u/20080722/11/56d1241b-e2e9-4eb5-86d4-c3fc66b9b256.html?1507684147 ）。由于历史和实时数据本身都很重要，只能在不停止数据导入的情况下，在线重建索引。
先 drop index idx_p_WAP_content FORCE; 成功后，在重新创建索引。

CREATE INDEX idx_p_WAP_content on T_WAP_content(DATA) INDEXTYPE IS CTXSYS.CONTEXT
parameters('lexer Miss_VGRAM_LEXER FILTER CTXSYS.INSO_FILTER memory 50m STORAGE MISS.MISSSTORE') ;

结果运行几个小时后，数据库本身就挂了，报 ORA-27101: shared memory realm does not exist。等错误。
重新startup数据库能恢复。
尝试了增加redo log buf，增大了5倍，添加 redo log 的数量，由原来的100M的3个，增加到500M的四个。
把索引创建一次占用的内存也有500M改小到50M。试了好几次，问题依旧。
在网上也查了相关的错误一般都是启动过程中报ORA-27101的错误，像我这样不运行新建索引，就一切正常，一运行创建这个全文索引，几个小时后就做不下去死掉的情况好像没有看到。
很是郁闷，想请大虾们帮帮忙。。。。。。。。。。。。。。。。。。。郁闷中的人等待你的拯救！
下面是oracle日志的摘要：
==========================
alert_missdb.log
==========================
Fri Aug 1 10:27:39 2008
Starting ORACLE instance (normal)
LICENSE_MAX_SESSION = 0
LICENSE_SESSIONS_WARNING = 0
SCN scheme 2
Using log_archive_dest parameter default value
LICENSE_MAX_USERS = 0
SYS auditing is disabled
Starting up ORACLE RDBMS Version: 9.2.0.8.0.
System parameters with non-default values:
processes = 150
timed_statistics = TRUE
shared_pool_size = 83886080
large_pool_size = 16777216
java_pool_size = 83886080
control_files = /RaidDisk/oracle/oradata/missdb/control01.ctl, /RaidDisk/oracle/oradata/missdb/control02.ctl, /RaidDisk/oracle/oradata/missdb/control03.ctl
db_block_size = 16384
db_cache_size = 33554432
compatible = 9.2.0.0.0
log_buffer = 5242880
db_file_multiblock_read_count= 16
fast_start_mttr_target = 25
undo_management = AUTO
undo_tablespace = UNDOTBS1
undo_retention = 600
remote_login_passwordfile= EXCLUSIVE
db_domain =
instance_name = missdb
dispatchers = (PROTOCOL=TCP) (SERVICE=missdbXDB)
job_queue_processes = 10
hash_join_enabled = TRUE
background_dump_dest = /RaidDisk/oracle/admin/missdb/bdump
user_dump_dest = /RaidDisk/oracle/admin/missdb/udump
core_dump_dest = /RaidDisk/oracle/admin/missdb/cdump
sort_area_size = 524288
db_name = missdb
open_cursors = 300
star_transformation_enabled= FALSE
query_rewrite_enabled = FALSE
pga_aggregate_target = 25165824
aq_tm_processes = 1
PMON started with pid=2, OS id=30149
DBW0 started with pid=3, OS id=30151
LGWR started with pid=4, OS id=30153
CKPT started with pid=5, OS id=30155
SMON started with pid=6, OS id=30157
RECO started with pid=7, OS id=30159
CJQ0 started with pid=8, OS id=30161
QMN0 started with pid=9, OS id=30163
Fri Aug 1 10:27:40 2008
starting up 1 shared server(s) ...
starting up 1 dispatcher(s) for network address '(ADDRESS=(PARTIAL=YES)(PROTOCOL=TCP))'...
Fri Aug 1 10:27:40 2008
ALTER DATABASE MOUNT
Fri Aug 1 10:27:44 2008
Successful mount of redo thread 1, with mount id 2975754524
Fri Aug 1 10:27:44 2008
Database mounted in Exclusive Mode.
Completed: ALTER DATABASE MOUNT
Fri Aug 1 10:27:44 2008
ALTER DATABASE OPEN
Fri Aug 1 10:27:44 2008
Beginning crash recovery of 1 threads
Fri Aug 1 10:27:44 2008
Started redo scan
Fri Aug 1 10:27:45 2008
Completed redo scan
289491 redo blocks read, 1001 data blocks need recovery
Fri Aug 1 10:27:46 2008
Started recovery at
Thread 1: logseq 13481, block 759083, scn 0.0
Fri Aug 1 10:27:46 2008
Recovery of Online Redo Log: Thread 1 Group 5 Seq 13481 Reading mem 0
Mem# 0 errs 0: /RaidDisk/oracle/oradata/missdb/log5.ora
Fri Aug 1 10:27:47 2008
Completed redo application
Fri Aug 1 10:27:47 2008
Ended recovery at
Thread 1: logseq 13481, block 1048574, scn 0.173225765
1001 data blocks read, 1001 data blocks written, 289491 redo blocks read
Crash recovery completed successfully
Fri Aug 1 10:27:47 2008
Thread 1 advanced to log sequence 13482
Thread 1 opened at log sequence 13482
Current log# 2 seq# 13482 mem# 0: /RaidDisk/oracle/oradata/missdb/log2.ora
Successful open of redo thread 1
Fri Aug 1 10:27:47 2008
SMON: enabling cache recovery
Fri Aug 1 10:27:47 2008
Successfully onlined Undo Tablespace 1.
Fri Aug 1 10:27:47 2008
SMON: enabling tx recovery
Fri Aug 1 10:27:47 2008
Database Characterset is ZHS16CGB231280
replication_dependency_tracking turned off (no async multimaster replication found)
Completed: ALTER DATABASE OPEN
Fri Aug 1 16:12:49 2008
Thread 1 advanced to log sequence 13483
Current log# 3 seq# 13483 mem# 0: /RaidDisk/oracle/oradata/missdb/log6.ora
Fri Aug 1 16:26:22 2008
/* OracleOEM */ ALTER TABLESPACE "MISS"NOLOGGING
Fri Aug 1 16:26:22 2008
Completed: /* OracleOEM */ ALTER TABLESPACE "MISS"NOLOGGING
Fri Aug 1 21:37:32 2008
Thread 1 advanced to log sequence 13484
Current log# 4 seq# 13484 mem# 0: /RaidDisk/oracle/oradata/missdb/log4.ora
Fri Aug 1 23:40:16 2008
RECO: terminating instance due to error 313
Instance terminated by RECO, pid = 30159

==========================
missdb_ora_30167.trc
==========================
Du/RaidDisk/oracle/admin/missdb/bdump/missdb_ora_30167.trc
Oracle9i Enterprise Edition Release 9.2.0.8.0 - Production
With the Partitioning, OLAP and Oracle Data Mining options
JServer Release 9.2.0.8.0 - Production
ORACLE_HOME = /RaidDisk/oracle/product/9.2
System name: Linux
Node name: vastdb
Release: 2.6.9-55.ELsmp
Version: #1 SMP Fri Apr 20 17:03:35 EDT 2007
Machine: i686
Instance name: missdb
Redo thread mounted by this instance: 0 <none>
Oracle process number: 0
30167

*** 2008-08-01 23:40:33.939
OPIRIP: Uncaught error 313. Error stack:
ORA-00313: open failed for members of log group of thread

我是在外地现场解决这个问题，已经拖了好几天了，没能搞定，很是痛苦。。。。。。。。希望高手能给指条明路。。。

...全文

447 33 打赏收藏转发到动态举报

写回复

用AI写文章

33 条回复

切换为时间正序

请发表友善的回复…

发表回复

goneaway 2008-10-17

打赏
举报

sqlload的导入程序和全文更新的job占用的datebuf看上去也很多,但又是必须的,不太好找一个平衡点

goneaway 2008-10-17

打赏
举报

现在换成了10g 64bit的自动分配模式,SGA的情况如下:
NAME BYTES RES
-------------------------------- ---------- ---
Fixed SGA Size 2026064 No
Redo Buffers 14749696 No
Buffer Cache Size 3925868544 Yes
Shared Pool Size 218103808 Yes
Large Pool Size 16777216 Yes
Java Pool Size 16777216 Yes
Streams Pool Size 0 Yes
Granule Size 16777216 No
Maximum SGA Size 4194304000 No
Startup overhead in Shared Pool 83886080 No
Free SGA Memory Available 0
但检索速度依然很慢.各位大佬看看是否有不合理的地方.

無名VF 2008-09-28

打赏
举报

BlueskyWide 2008-09-28

打赏
举报

8G内存，四CPU,硬件我看基本够用了。

但你可以多向Oracle厂商工程师及硬件支持工程师进行咨询!!!

本人在26楼提供的参数你试过了吗？

goneaway 2008-09-28

打赏
举报

发现系统确实是32位，所以限制了内存的配置。打算更新到64位的linux+64位的oracle10g。
另外，内存8G对2T的数据是否够用。如果要配置6T的数据库内存配比推荐又是多少？
cpu现在是单个四核的E5405不知道够用否，需要多cpu吗，是否需要使用7系列的cpu

liuyi8903 2008-09-20

打赏
举报

持续使用vmstat 388 2444 >/tmo/

之类的观察几天吧．看看系统的峰值情况再说

BlueskyWide 2008-09-19

打赏
举报

不知楼主现在如何？甚为关切。

如果是 UNIX+Oracle9i系统，则给个参考：

关于oracle内存不足的优化方案

--关侦听
connect /as sysdba;
lsnrctl stop;
--修改参数并重起
sqlplus /nolog;
sql> connect /as sysdba;
sql> create pfile='/tmp/pfile_0819.ora' from spfile;
sql> alter system set cursor_sharing = similar scope=spfile;
sql> alter system set shared_pool_size= 300m scope=spfile;
sql> alter system set shared_pool_reserved_size= 30m scope=spfile;
sql> alter system set java_pool_size=16m scope=spfile;
sql> alter system set large_pool_size=64m scope=spfile;
sql> alter system set pga_aggregate_target=150m scope=spfile;
sql> alter system set sga_max_size= 1400m scope=spfile;
sql> shutdown immediate;
--启动数据库
sql> startup;
--启动侦听
lsnrctl start;

richard_2010 2008-09-19

打赏
举报

oracledbalgtu 很强大呢，学习。

jdsnhan 2008-09-18

打赏
举报

又有人再挖高分帖，喜欢。
看着帖子挺热闹。
8g的内存，分配给oracle的近1%。
150个连接数，却有200多g的数据。
难道是持续运行了n年的老服务器？
老服务器却又能扩充如此大的内存，如此大的硬盘，比较奇怪。

建议LZ把你机器的操作系统，硬件配置都说出来

yafeiok 2008-09-18

打赏
举报

liuyi8903 2008-09-14

打赏
举报

syslog里面有什么信息吗？

free -m是什么情况？

ePower518 2008-09-08

打赏
举报

1、检查系统是否存在1.7G的限制，即是否为32位系统。
如果没有限制，则使用上述oracledbalgtu 的配置没有问题。不能起来我怀疑有这个限制的。
2、db_cache=320M,shared_pool=800M,pga 100M
这样配置不太合理的。如果是SGA 存在1.7G限制，可以参考:
db_cache=1000M,shared_pool=280M,pga 400M

[Quote=引用 17 楼 oracledbalgtu 的回复:]
不知道行不行，现在用top查memory使用了一半。等会不知道会涨到多少。

说明你的这个系统，不是单独给数据库用的，肯定其它应用也在使用，并且把memory使用了很多。
自然就不能使用上面给出的参数了。
根据你们的实际内存剩于情况改吧。

引用 13 楼 goneaway 的回复:
还好以前的参数文件有保存，恢复回来了。
暂时把
db_cache=320M,shared_pool=800M,pga 100M
不知道行不行，现在用top查memory使用了一半。等…
[/Quote]

ora_bak 2008-08-21

打赏
举报

帮顶一下

哪位高手给我解决一下问题啊
我问题在这里：http://topic.csdn.net/u/20080821/16/777304fc-0da6-4d6d-b418-332aaf2cecaa.html

goneaway 2008-08-06

打赏
举报

不做这个重建索引就不会死掉的，很是没辙。

goneaway 2008-08-06

打赏
举报

还有一个接受数据，并生成数据文件的程序，但根据时段的不同，数据的流量也有比较大的变化。不知道怎样设置会比较好。
昨天一大早开始运行重建全文索引的脚本，一整个白天都还没有挂，晚上回去，早上一来就看到挂了，唉。。。。。。。。。。。
不知怎么设置才比较好。

oracledbalgtu 2008-08-06

打赏
举报

不知道行不行，现在用top查memory使用了一半。等会不知道会涨到多少。

说明你的这个系统，不是单独给数据库用的，肯定其它应用也在使用，并且把memory使用了很多。
自然就不能使用上面给出的参数了。
根据你们的实际内存剩于情况改吧。

[Quote=引用 13 楼 goneaway 的回复:]
还好以前的参数文件有保存，恢复回来了。
暂时把
db_cache=320M,shared_pool=800M,pga 100M
不知道行不行，现在用top查memory使用了一半。等会不知道会涨到多少。
[/Quote]

goneaway 2008-08-06

打赏
举报

kernel.sem = 250 32000 100 128
kernel.shmmax = 2147483648
kernel.shmall = 2097152

goneaway 2008-08-06

打赏
举报

[Quote=引用 14 楼 oracledbalgtu 的回复:]
系统参数肯定没有改，检查一下吧。

/etc/sysctl.conf
参考如下：
kernel.sem = 250 32000 100 128
kernel.shmmax = 2147483648
kernel.shmall = 2097152

你们这系统没啥说的了，唉。。。。。

引用 12 楼 goneaway 的回复:
晕，报out memory，oracle起不起来了
[/Quote]

现在系统的参数就是这样的呀

goneaway 2008-08-06

打赏
举报

这是今天凌晨的trc文件
/RaidDisk/oracle/admin/missdb/bdump/missdb_s000_15164.trc
Oracle9i Enterprise Edition Release 9.2.0.8.0 - Production
With the Partitioning, OLAP and Oracle Data Mining options
JServer Release 9.2.0.8.0 - Production
ORACLE_HOME = /RaidDisk/oracle/product/9.2
System name: Linux
Node name: vastdb
Release: 2.6.9-55.ELsmp
Version: #1 SMP Fri Apr 20 17:03:35 EDT 2007
Machine: i686
Instance name: missdb
Redo thread mounted by this instance: 1
Oracle process number: 10
Unix process pid: 15164, image: oracle@vastdb (S000)

*** 2008-08-06 04:11:40.067
OPIRIP: Uncaught error 313. Error stack:
ORA-00313: open failed for members of log group of thread
ORA-00313: open failed for members of log group of thread

goneaway 2008-08-04