vmware server 2.0安装oracle10grac之解决问题篇

http://space.itpub.net/95233/viewspace-715621

 

安装环境:
vmware server 2.0
host os:win7旗舰版 64位
guest os:rhel5.4 32位
oracle 10g rac
 
一、compat-libstdc++-3.2-1.i386.rpm无法安装
如果卸载掉RHEL5.4中的compat-libstdc++-296,则需无法安装compat-oracle-el5包。
处理方法:暂时未安装
 
二、vmware server 2.0 克隆虚拟机
vmware server 2.0 克隆虚拟机操作步骤如下:
首先成功安装好虚拟机rac1,我要克隆rac1到rac2
 
1.创建一个rac2目录(目标目录文件夹)
2.复制rac1目录下所有文件到rac2目录
3.更改目标目录里的rac1相关的前缀文件名,改为rac2(需要更改含有rac1的名字,注意:只改前缀名)
4.修改rac1.vmx,把里面的 rac1都修改为 rac2
5.然后再将虚拟机加入到inventory里,启动虚拟机!
这时候还需要把rac1的网卡删除掉,重新添加1块网卡,要不然和rac1的网卡地址 HWaddr 相冲突,启动起来后还需要修改ip和主机名!
 
三、时间同步
采用NTP方式
参考http://blog.csdn.net/tianlesoftware/article/details/5315587
 
四、Error while copying directory /home/oracle/app/oracle/10R2/crs with exclude file list 'null' to nodes 'rac2'
在ORACLE 10G在安装cluster时,第到61%的时候,就提示如下错误: 
WARNING: Error while copying directory /home/oracle/app/oracle/10R2/crs with exclude file list 'null' to nodes 'rac2'.
 
[PRKC-1002 : All the submitted commands did not execute successfully](类似)
 
解决:
 
这个错误可以忽略
 
原因: 在安装 Oracle 集群件、数据库以及随附 CD 期间,Oracle Universal Installer(OUI)将首先安装本地节点的软件(运行该安装程序的本地节点,我在rac1上运行的安装程序)。然后,将该软件以远程方式复制到集群中的其余节点(即rac2).
 
在远程复制过程中,OUI将在每个远程节点上执行 UNIX“tar”命令,以提取进行了存档和复制的文件。如果执行安装的节点(即本地节点rac1)上的日期和时间大于其要进行复制的节点(远程节点rac2)上的日期和时间,那么OUI将在“tar”中引发一个错误,以指示其在试图提取带有时间戳的文件时失败。 
 
Error while copying directory 
/u01/app/oracle/product/crs with exclude file list 'null' to nodes 'rac2'.
[PRKC-1002 :All the submitted commands did not execute successfully]
---------------------------------------------
rac2:
/bin/tar:./bin/lsnodes:time stamp 2010-09-13 09:21:34 is 735 s in the future
/bin/tar:./bin/olsnodes:time stamp 2010-09-13 09:21:34 is 735 s in the future
...(more errors on this node)
 
请注意,尽管这看起来像OUI中一个严重的错误,但您完全可以将其看作是一个警告而忽略。“tar”命令 DOES确实提取了文件;然而,
当您在远程节点上执行文件列表时(使用ls -l),它们将缺少时间字段,直到服务器上的时间大于该文件的时间戳。 
 
在启动以上任何一个所述安装之前,确保尽可能将集群的每个成员节点设置为相同的时间和日期,做好时间同步,但是我为了安装的顺利
一般让本地安装节点比远程复制节点慢10分钟
 
[root@rac1 ~]# date -s "Thu Dec 23 12:22:28 CST 2010"
[root@rac2 ~]# date -s "Thu Dec 23 12:32:28 CST 2010"
 
本篇文章来源于 Linux公社网站(www.linuxidc.com)  原文链接:http://www.linuxidc.com/Linux/2011-08/40137.htm
 
五、/opt/ora10g/product/10.2.0/db_1/jdk/jre/bin/java: error while loading shared libraries: libpthread.so.0: cannot open shared object file: No such file or directory
 
解决方法:“/opt/ora10g/product/10.2.0/db_1/bin/srvctl”这个文件里面的LD_ASSUME_KERNEL也得注释掉
 
本篇文章来源于 Linux公社网站(www.linuxidc.com)  原文链接:http://www.linuxidc.com/Linux/2011-02/31975.htm
 
六、linux ntp 同步时间不成功
解决方法:
时间同步的命令应该是ntpdate IP地址
并且启动了ntpd服务的机器无法使用ntpdate命令。
我将node2机器上的nptd服务停止掉,然后在node2机器上的cron创建ntpdate任务,只启动node1的ntpd服务即可。
验证命令行:ssh node1 date;ssh node2 date
 
七、clusterware安装失败清除crs
参考:http://database.51cto.com/art/200802/66240.htm
 
八、创建实例前首先要配置好监听
 
九、卸载oracle10g rac crs
注意:卸载database软件前,必须通过netca卸载掉listener;
卸载CRS时,直接执行rootdelete.sh即可,不要使用参考文章中介绍的命令行,否则执行rootdeinstall.sh会出错
参考:
http://yangtingkun.itpub.net/post/468/502731
http://yangtingkun.itpub.net/post/468/502774
 
终极清理脚本:
/bin/rm -f /etc/init.d/init.cssd
/bin/rm -f /etc/init.d/init.crs
/bin/rm -f /etc/init.d/init.crsd
/bin/rm -f /etc/init.d/init.evmd
/bin/rm -f /etc/rc2.d/K96init.crs
/bin/rm -f /etc/rc2.d/S96init.crs
/bin/rm -f /etc/rc3.d/K96init.crs
/bin/rm -f /etc/rc3.d/S96init.crs
/bin/rm -f /etc/rc5.d/K96init.crs
/bin/rm -f /etc/rc5.d/S96init.crs
/bin/rm -rf /etc/oracle
/bin/rm -f /etc/inittab.crs
/bin/rm -f /etc/oratab
/bin/rm -f /etc/oraInst.loc
/bin/cp /etc/inittab.orig /etc/inittab
/bin/rm -rf /tmp/.oracle
/bin/rm -rf /opt/ora10g/product/10.1.0/crs_1
 
 
 
 
十、卸载RAC数据库时忘记先卸载listener再卸载database软件,导致卸载clusterware时出错(执行rootdelete.sh时出错)
解决方法:停掉所有节点的CRS服务,命令行为./crsctl stop crs
参考:http://blog.csdn.net/tianlesoftware/article/details/6050606
 
十一、安装好RAC后,在用DBCA建库时选择ASM做为存储方案时,有时候会报错说ASM是单实例环境,不是RAC环境
 
安装好RAC后,在用DBCA建库时选择ASM做为存储方案时,有时候会报错说ASM是单实例环境,不是RAC环境,这样就无法继续建库下来,出错信息如下: 
  
The ASM instance configured on the local node is a single-instance ASM.To create a single-instance database using this ASM instance ,restart DBCA and select the single-instance database option ,to create a RAC database using this ASM instance,convert it to RAC ASM first. 
  
这个错误一般是发生在重装clusterware和database后,这样无论怎么样重启DBCA运行都会报同样的错。
具体的解决办法便是在/etc/oratab里面的关于ASM的记录+ASM:/opt/oracle/database:Y;这么一行删除掉,再接着建库就可以了。
 
十二、RAC lsnr 无法启动
 
参考:
http://www.itpub.net/thread-785670-1-1.html
 
十三、配置ASM时(在node1执行dbca命令),出错提示无法发现node2上的监听或asm实例未注册到监听
解决方法:
在node2的network/admin/listener.ora增加下面一行,然后使用srvctl命令重启node2的监听,最后再在node1的asm磁盘管理界面上点击mount按钮即可。
(ADDRESS = (PROTOCOL = TCP)(HOST = 127.0.0.1)(PORT = 1521)(IP = FIRST))
 
节点node1/node2中listener.ora文件最终的内容都应包括:
      (ADDRESS = (PROTOCOL = TCP)(HOST = node2-vip)(PORT = 1521)(IP = FIRST))
      (ADDRESS = (PROTOCOL = TCP)(HOST = 127.0.0.1)(PORT = 1521)(IP = FIRST))
      (ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.41.137)(PORT = 1521)(IP = FIRST))
 
十四、卸载掉RAC再重新安装RAC时如果crs中某些服务的state为UNKNOWN(通过crs_stat -t查看)无法通过dbca创建数据库
解决方法:先卸载掉database软件(先卸载监听,再卸载database软件),再通过"srvctl remove"命令去掉那些state为UNKNOWN的crs服务,最后保留gsd,ons,vip服务即可:
./crs_stat -t
Name           Type           Target    State     Host        
------------------------------------------------------------
ora.node1.gsd  application    ONLINE    ONLINE    node1       
ora.node1.ons  application    ONLINE    ONLINE    node1       
ora.node1.vip  application    ONLINE    ONLINE    node1       
ora.node2.gsd  application    ONLINE    ONLINE    node2           
ora.node2.ons  application    ONLINE    ONLINE    node2           
ora.node2.vip  application    ONLINE    ONLINE    node2       
 
 
 
十五、RAC中执行crs_stop -all后提示一些服务停不了,再用crs_stat -t查看状态的时候,停不掉的服务会显示状态是UNKNOWN,服务在UNKNOWN状态下用 crs_start 不能启动服务
参考:http://prefectliu.blog.163.com/blog/static/2363081820106274636628/
可以采用两种方法去重新启动crs服务:
1:转换到root用户下用/etc/init.d/init.crs stop先禁用crs,然后再用/etc/init.d/init.crs start去启用crs,启用crs后会自动启动crs的一系列服务,注意此种方法需要在两台节点上都执行;
2:是用crs_stop -f  参数把crs中状态是UNKNOWN的服务关掉,然后再用crs_start -f (加一个-f的参数)启动所有的服务就可以
原文地址:https://www.cnblogs.com/taowang2016/p/3414002.html