<?xml version="1.0" encoding="utf-8"?><?xml-stylesheet type='text/xsl' href='http://blue-prince.spaces.live.com/mmm2008-05-17_13.22/rsspretty.aspx?rssquery=en-US;http%3a%2f%2fblue-prince.spaces.live.com%2fcategory%2fWork%2ffeed.rss' version='1.0'?><rss version="2.0" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" xmlns:msn="http://schemas.microsoft.com/msn/spaces/2005/rss" xmlns:live="http://schemas.microsoft.com/live/spaces/2006/rss" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" xmlns:wfw="http://wellformedweb.org/CommentAPI/"><channel><title>blue_prince: Work</title><description /><link>http://blue-prince.spaces.live.com/?_c11_BlogPart_BlogPart=blogview&amp;_c=BlogPart&amp;partqs=catWork</link><language>en-US</language><pubDate>Sat, 21 Jun 2008 08:34:51 GMT</pubDate><lastBuildDate>Sat, 21 Jun 2008 08:34:51 GMT</lastBuildDate><generator>Microsoft Spaces v1.1</generator><docs>http://www.rssboard.org/rss-specification</docs><ttl>60</ttl><cf:parentRSS>http://blue-prince.spaces.live.com/blog/feed.rss</cf:parentRSS><live:type>blogcategory</live:type><live:identity><live:id>1357526105754387075</live:id><live:alias>blue-prince</live:alias></live:identity><cf:listinfo><cf:group ns="http://schemas.microsoft.com/live/spaces/2006/rss" element="typelabel" label="Type" /><cf:group ns="http://schemas.microsoft.com/live/spaces/2006/rss" element="tag" label="Tag" /><cf:group element="category" label="Category" /><cf:sort element="pubDate" label="Date" data-type="date" default="true" /><cf:sort element="title" label="Title" data-type="string" /><cf:sort ns="http://purl.org/rss/1.0/modules/slash/" element="comments" label="Comments" data-type="number" /></cf:listinfo><item><title>Qlogic Infiniband RDS高速互联驱动程序安装及配置</title><link>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!991.entry</link><description>&lt;p&gt;在配置基于RDS协议的Infiniband高速内部互联的RAC数据库方案时，第一步必须是安装好驱动程序并配置好内部互联的IP地址，保证内部互联配置完成，才能进行下一步的RAC数据库安装和创建。下面简要介绍一下Infiniband安装配置的过程：&lt;br&gt;一、首先删除操作系统自带的OFED模块，否则在日后的使用中，可能会和后续安装的Infiniband驱动程序发生冲突： 
&lt;blockquote&gt;
&lt;p&gt;#rm -rf /lib/modules/2.6.9-55.ELlargesmp/kernel/drivers/infiniband&lt;br&gt;#rm -rf /usr/src/kernels/2.6.9-55.EL-largesmp-x86_64/drivers/infiniband&lt;/blockquote&gt;
&lt;p&gt;这里面的2.6.9-55.Ellargesmp是LINUX的内核版本号，根据安装机器的OS内核而定。重启服务器，执行lsmod 去检查OFED是否还在运行。&lt;br&gt;&lt;span&gt;&lt;/span&gt;&lt;br&gt;二、编译Infiniband安装程序：&lt;br&gt;将InfiniServ安装文件COPY至相应目录，解压并编译：
&lt;blockquote&gt;
&lt;p&gt;#cd /u01&lt;br&gt;#tar –zxvf InfiniServ. 4.1.0.2.2.tgz&lt;br&gt;#cd InfiniServ. 4.1.0.2.2/ALL_HOST&lt;br&gt;#./do_build&lt;/blockquote&gt;
&lt;p&gt;编译完成后，该OS上的Ininiband安装文件即可生成，对应安装文件在/u01/InfiniServ.4.1.0.2.2/ALL_HOST/release/redhat/X86_64/InfiniServ.4.1.0.2.2G里面。&lt;br&gt;三、 安装Infiniband安装程序：
&lt;blockquote&gt;
&lt;p&gt;#cd /u01/InfiniServ.4.1.0.2.2/ALL_HOST/release/redhat/X86_64/InfiniServ.4.1.0.2.2G&lt;br&gt;#.INSTALL&lt;/blockquote&gt;
&lt;p&gt;屏幕显示如下画面：
&lt;blockquote&gt;
&lt;p&gt;SilverStorm Technologies Inc. InfiniBand 4.1.0.2.2 G Software
&lt;p&gt;1) Install/Uninstall Software&lt;br&gt;2) Reconfigure IP over IB&lt;br&gt;3) Reconfigure Driver Autostart&lt;br&gt;4) Update HCA Firmware&lt;br&gt;5) Generate Supporting Information for Problem Report&lt;br&gt;6) Host Setup via Fast Fabric&lt;br&gt;7) Host Admin via Fast Fabric&lt;br&gt;8 ) Chassis Admin via Fast Fabric&lt;br&gt;9) Externally Managed Switch Admin via Fast Fabric
&lt;p&gt;X) Exit&lt;/blockquote&gt;
&lt;p&gt;选择“1”，屏幕显示如下画面：
&lt;blockquote&gt;
&lt;p&gt;SilverStorm Technologies Inc. IB Install (4.1.0.2.2G release) Menu
&lt;p&gt;Please Select Install Action:
&lt;p&gt;0) IB Network Stack [ Install ] [Available]&lt;br&gt;1) IB Development [ Install ] [Available]&lt;br&gt;2) IB Boot [ Install ] [Available]&lt;br&gt;3) Fast Fabric [ Install ] [Available]&lt;br&gt;4) Virtual HBA (SRP) [ Install ] [Available]&lt;br&gt;5) Virtual NIC [ Install ] [Available]&lt;br&gt;6) IP over IB [ Install ] [Available]&lt;br&gt;7) MPI Runtime [ Install ] [Available]&lt;br&gt;8 ) MPI Development [ Install ] [Available]&lt;br&gt;9) MPI Source [ Install ] [Available]&lt;br&gt;a) uDAPL [ Install ] [Available]&lt;br&gt;b) SDP [ Install ] [Available]&lt;br&gt;c) RDS [ Install ] [Available]
&lt;p&gt;P) Perform the selected actions&lt;br&gt;I) Install All&lt;br&gt;U) Uninstall All
&lt;p&gt;X) Return to Previous Menu (or ESC)&lt;/blockquote&gt;
&lt;p&gt;上图中显示，P：执行选择的项&lt;br&gt;I：全部安装以上11项&lt;br&gt;U：全部卸载以上11项&lt;br&gt;选择安装某项的方法如下：&lt;br&gt;例如要安装IB Network Stack项，我们可以通过在键盘上敲击IB Network Stack前面的数字0，来切换到Install提示（此处提示共有Install，Do Not Install或Up To Date三种选择）。&lt;br&gt;如果HPC应用，只需选择0,1,3,6,7,8,9,b项进行安装即可。&lt;br&gt;如果使用RDS for Oracle应用， 选择全部进行安装即可&lt;br&gt;如果使用IPOIB for Oracle应用，选择0,1,3,6 进行安装就可以。&lt;br&gt;选择各项为Install提示后，&lt;br&gt;输入”P”，执行，系统出现如下画面：
&lt;blockquote&gt;
&lt;p&gt;——————————————————————————-&lt;br&gt;Installing IB Network Stack…&lt;br&gt;Adding module dependencies…&lt;br&gt;Adding memory locking limits…&lt;br&gt;Copying ibt.ko…&lt;br&gt;Copying ics_dsc.ko…&lt;br&gt;Copying 82808XA.ko…&lt;br&gt;Copying mt23108vpd.ko…&lt;br&gt;Copying mt25218vpd.ko…&lt;br&gt;Creating IB Network Stack (iba) system startup files…&lt;br&gt;Creating IB Port Monitor (iba_mon) system startup files…&lt;br&gt;——————————————————————————-&lt;br&gt;Installing IB Development…&lt;br&gt;——————————————————————————-&lt;br&gt;Installing Fast Fabric…&lt;br&gt;——————————————————————————-&lt;br&gt;Installing IP over IB Driver…&lt;br&gt;Copying ipoib.ko…&lt;br&gt;Assign IP over IB static IPV4 addresses now? [n]: y&lt;br&gt;提示是否配置IPOIB，输入”y”,出现如下画面：&lt;br&gt;You may configure an IP over IB interface for each IB port&lt;br&gt;Or you may select to have IP over IB only run on some IB ports&lt;br&gt;Or you may select to configure redundant IB ports with a&lt;br&gt;pair of IB ports running a single IP over IB interface&lt;br&gt;How many IP over IB interfaces would you like to configure? [1]:&lt;/blockquote&gt;
&lt;p&gt;提示需要配置多少个ip，默认为1个，如果我们只需设置1个IP地址，直接回车或输入“1”回车，屏幕出现如下画面：
&lt;blockquote&gt;
&lt;p&gt;Preparing to create IP over IB ifcfg files in /etc/sysconfig/network-scripts&lt;br&gt;Assign interface names sequentially starting with ib1? [y]:&lt;br&gt;Assign Internet Addresses sequentially from a base IP address? [y]:&lt;br&gt;Enter IPV4 address in dot notation for ib1: 192.168.100.145&lt;br&gt;Is IPV4 address ‘192.168.100.145′ correct? (y/n): y&lt;br&gt;Enter IPV4 netmask in dot notation for ib1 192.168.100.145 [255.255.255.0]:&lt;br&gt;Creating ifcfg-ib1 for 192.168.100.145 mask 255.255.255.0
&lt;p&gt;IP over IB requires /etc/sysconfig/ipoib.cfg specify parameters&lt;br&gt;for each IP over IB device.&lt;br&gt;The default configuration file provides for a 2 port redundant configuration.&lt;br&gt;If you desire a different configuration for IP over IB, Manually edit the file.&lt;br&gt;Hit any key to continue…&lt;/blockquote&gt;
&lt;p&gt;根据屏幕提示输入：&lt;br&gt;Assign interface names sequentially starting with ib1? [y]:&lt;br&gt;提示是否要将IB接口名称设定为ib1, 直接回车或键入 y 回车.&lt;br&gt;Assign Internet Addresses sequentially from a base IP address? [y]:&lt;br&gt;提示是否要分配一个IP地址，直接回车或键入 y 回车.&lt;br&gt;在提示Enter IPV4 address in dot notation for ib1: 键入 IP 地址xxx.xxx.xxx.x并回车&lt;br&gt;在提示 Is IPV4 address ‘xxx.xxx.xxx.x’ correct? (y/n): 键入y并回车.&lt;br&gt;在提示 Enter IPV4 netmask in dot notation for ib1 xxx.xxx.xxx.x [255.255.255.0]: 回车 以设置默认值 (255.255.255.0).
&lt;p&gt;敲入任何键，继续：
&lt;blockquote&gt;
&lt;p&gt;Creating IP over IB (ipoib) system startup files…&lt;br&gt;——————————————————————————-&lt;br&gt;Installing MPI Runtime…&lt;br&gt;Make links for mpd in ///opt/iba/bin&lt;br&gt;Make links for mpd in ///usr/local/bin&lt;br&gt;——————————————————————————-&lt;br&gt;Installing MPI Development…&lt;br&gt;——————————————————————————-&lt;br&gt;Installing MPI Source…&lt;br&gt;——————————————————————————-&lt;br&gt;Installing uDAPL…&lt;br&gt;Copying udapl_module.ko…&lt;br&gt;Creating uDAPL (udapl) system startup files…&lt;br&gt;——————————————————————————-&lt;br&gt;Installing SDP Driver…&lt;br&gt;Copying ics_offload.ko…&lt;br&gt;Copying ics_sdp.ko…&lt;br&gt;Creating SDP (ics_sdp) system startup files…
&lt;p&gt;Enable IB Network Stack (iba) to autostart? [y]:&lt;br&gt;Enable IB Port Monitor (iba_mon) to autostart? [y]:&lt;br&gt;Enable IP over IB (ipoib) to autostart? [y]:&lt;br&gt;Enable uDAPL (udapl) to autostart? [y]: n&lt;br&gt;Enable SDP (ics_sdp) to autostart? [y]: n&lt;br&gt;Hit any key to continue…&lt;/blockquote&gt;
&lt;p&gt;在提示 Enable xxx to autostart? [y]: 键入 Y或N 回车,屏幕显示如下图：
&lt;blockquote&gt;
&lt;p&gt;Generating module dependencies…&lt;br&gt;Updating HCA Firmware …&lt;br&gt;Select HCAs to Update:&lt;br&gt;1) HCA 1 (23108 Rev a1 psid “MT_0030000001″ Node GUID: 0×00066a0098004c15)&lt;br&gt;Selection (a for all, n for none) [a]:&lt;/blockquote&gt;
&lt;p&gt;提示是否更新HCA firmware 版本，输入 n , 回车，屏幕出现最初画面：
&lt;blockquote&gt;
&lt;p&gt;SilverStorm Technologies Inc. InfiniBand 4.1.0.2.2G Software
&lt;p&gt;1) Install/Uninstall Software&lt;br&gt;2) Reconfigure IP over IB&lt;br&gt;3) Reconfigure Driver Autostart&lt;br&gt;4) Update HCA Firmware&lt;br&gt;5) Generate Supporting Information for Problem Report&lt;br&gt;6) Host Setup via Fast Fabric&lt;br&gt;7) Host Admin via Fast Fabric&lt;br&gt;8 ) Chassis Admin via Fast Fabric&lt;br&gt;9) Externally Managed Switch Admin via Fast Fabric
&lt;p&gt;X) Exit&lt;/blockquote&gt;
&lt;p&gt;敲入“x”退出安装。
&lt;p&gt;5) 重新启动系统&lt;br&gt;#reboot&lt;br&gt;6) 重新启动系统后，检查HCA驱动是否正常启动&lt;br&gt;#lsmod&lt;br&gt;显示如下图：
&lt;blockquote&gt;
&lt;p&gt;o ipoib&lt;br&gt;o mt23108vpd&lt;br&gt;o ics_dsc&lt;br&gt;o ics_offload&lt;br&gt;o ibt&lt;br&gt;o scsi_mod&lt;br&gt;o ics_sdp&lt;/blockquote&gt;
&lt;p&gt;至此，此节点的Infiniserv软件安装完成。
&lt;div&gt;&lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=1357526105754387075&amp;page=RSS%3a+Qlogic+Infiniband+RDS%e9%ab%98%e9%80%9f%e4%ba%92%e8%81%94%e9%a9%b1%e5%8a%a8%e7%a8%8b%e5%ba%8f%e5%ae%89%e8%a3%85%e5%8f%8a%e9%85%8d%e7%bd%ae&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=blue-prince.spaces.live.com&amp;amp;GT1=blue-prince"&gt;</description><comments>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!991.entry#comment</comments><guid isPermaLink="true">http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!991.entry</guid><pubDate>Wed, 07 May 2008 06:53:54 GMT</pubDate><slash:comments>4</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://blue-prince.spaces.live.com/blog/cns!12D6E6CCFACF4283!991/comments/feed.rss</wfw:commentRss><wfw:comment>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!991.entry#comment</wfw:comment><dcterms:modified>2008-05-07T06:53:54Z</dcterms:modified></item><item><title>Linux上如何不重启识别新存储</title><link>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!990.entry</link><description>&lt;p style="margin:0cm 0cm 0pt;text-indent:26.25pt"&gt;&lt;font size=2&gt;&lt;font color="#000000"&gt;&lt;span style="font-family:宋体"&gt;上周在一台生产机器上添加了一台新存储，并且成功不重启就识别了新添加的&lt;span lang=EN-US&gt;LUN&lt;/span&gt;。关于如何&lt;span lang=EN-US&gt;LINUX&lt;/span&gt;不重启如何识别新的&lt;span lang=EN-US&gt;LUN&lt;/span&gt;，&lt;span lang=EN-US&gt;Fenng&lt;/span&gt;有过一篇文章介绍过了：&lt;a href="http://www.dbanotes.net/techmemo/add_lun_without_reboot_linux.html" target="_blank"&gt;Linux 如何不重启而识别新增的 LUN&lt;/a&gt;&lt;/span&gt;&lt;/font&gt;&lt;font color="#000000"&gt;&lt;span style="font-family:宋体"&gt;，除了&lt;/span&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;QLogic FC HBA LUN Scan Utility&lt;/span&gt;&lt;span style="font-family:宋体"&gt;这个脚本，还有其他方式可以也可以识别，具体可以看&lt;span lang=EN-US&gt;Fenng BLOG&lt;/span&gt;中的回复&lt;/span&gt;&lt;span style="font-family:宋体"&gt;。这里面简要介绍一下存储的配置过程，我添加的存储是&lt;span lang=EN-US&gt;EMC CX700&lt;/span&gt;，以此为例。在布好光纤线，配置好光纤交换机的&lt;span lang=EN-US&gt;ZONE&lt;/span&gt;之后，需要把主机的&lt;/span&gt;&lt;span lang=IT style="font-family:宋体"&gt;/etc/Navisphere/agent.config&lt;/span&gt;&lt;span style="font-family:宋体"&gt;文件里面添加新存储的&lt;span lang=IT&gt;IP&lt;/span&gt;地址，然后重启&lt;span lang=IT&gt;N&lt;/span&gt;&lt;/span&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;aviagent&lt;/span&gt;&lt;span style="font-family:宋体"&gt;。&lt;span lang=EN-US&gt;Naviagent&lt;/span&gt;重启的话对于主机现有的存储访问是没有影响的，如果不重启，那么在存储端也是可以看到主机信息的，不过并不会有主机名等详细信息的，需要用户手工添加注册信息。然后就在存储里面配置&lt;span lang=EN-US&gt;storage group&lt;/span&gt;，把要访问的&lt;span lang=EN-US&gt;LUN&lt;/span&gt;和主机设置好，按&lt;span lang=EN-US&gt;Fenng BLOG&lt;/span&gt;中步骤运行&lt;/span&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;QLogic FC HBA LUN Scan Utility&lt;/span&gt;&lt;span style="font-family:宋体"&gt;，&lt;/span&gt;&lt;span style="font-family:宋体"&gt;主机上&lt;span lang=EN-US&gt;powermt config&lt;/span&gt;一下，就识别到新的存储了。值得一提的是，在我的环境中，新添加的&lt;span lang=EN-US&gt;LUN&lt;/span&gt;没有具体的&lt;span lang=EN-US&gt;LUN&lt;/span&gt;编号，这个对于使用还是有些麻烦的。&lt;span lang=EN-US&gt;&lt;/span&gt;&lt;/span&gt;&lt;/font&gt;&lt;/font&gt; 
&lt;div&gt;&lt;font size=2&gt;&lt;/font&gt;&lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=1357526105754387075&amp;page=RSS%3a+Linux%e4%b8%8a%e5%a6%82%e4%bd%95%e4%b8%8d%e9%87%8d%e5%90%af%e8%af%86%e5%88%ab%e6%96%b0%e5%ad%98%e5%82%a8&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=blue-prince.spaces.live.com&amp;amp;GT1=blue-prince"&gt;</description><comments>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!990.entry#comment</comments><guid isPermaLink="true">http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!990.entry</guid><pubDate>Tue, 06 May 2008 06:03:20 GMT</pubDate><slash:comments>0</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://blue-prince.spaces.live.com/blog/cns!12D6E6CCFACF4283!990/comments/feed.rss</wfw:commentRss><wfw:comment>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!990.entry#comment</wfw:comment><dcterms:modified>2008-05-06T06:04:19Z</dcterms:modified></item><item><title>祸不单行</title><link>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!847.entry</link><description>&lt;p style="margin:0cm 0cm 0pt;text-indent:21pt"&gt;&lt;span style="font-family:宋体"&gt;&lt;font size=2&gt;本来今天挺高兴的，因为搞定了虚拟带库的备份配置，先说一下吧。&lt;span lang=EN-US&gt;&lt;/span&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt;text-indent:21pt"&gt;&lt;span style="font-family:宋体"&gt;&lt;font size=2&gt;在第一台主机安装好&lt;span lang=EN-US&gt;Veritas NetBackup&lt;/span&gt;软件后，停止&lt;span lang=EN-US&gt;NBU&lt;/span&gt;的时候主机就宕机了，出现了黑屏，然后一直死在那边。只好重启，不想重启后依然如故。&lt;span lang=EN-US&gt;OK&lt;/span&gt;，这台不行，那就换另外一台吧。再重新安装配置好，测试停止的时候还是一样，死机了。折腾了很长一段时间还是没有搞定，由于是测试，出于节约时间的考虑，那就先不测试停止&lt;span lang=EN-US&gt;NBU&lt;/span&gt;服务了，反正能够启动就行。然后就是配置虚拟带库，光纤交换机上配置好了以后，主机死活认不到带库。带库厂商在一边想办法，&lt;span lang=EN-US&gt;Veritas&lt;/span&gt;的工程师说先测试磁盘备份吧，至少先把&lt;span lang=EN-US&gt;Veritas&lt;/span&gt;配置好。&lt;span lang=EN-US&gt;VERITAS&lt;/span&gt;磁盘备份测试完成以后，带库厂商还是没有找到问题所在。看到&lt;span lang=EN-US&gt;VERITAS&lt;/span&gt;工程师在这边等也不是办法，让她简单介绍了一下操作步骤，就先回去了。接下又是我一个人在无止境的折腾，存储厂商的人在边上看着，看到没啥进展就准备撤了，说回去再问问同事，下星期再过来配置。问题是他们下周有时间，我没时间呀！让他们暂留一小会儿，我再继续折腾下来，终于在一台主机重启后发现了带库。接下又是开始&lt;span lang=EN-US&gt;NBU&lt;/span&gt;的配置，不想这次是主机可以认到磁带，&lt;span lang=EN-US&gt;NBU&lt;/span&gt;怎么整都无法认到磁带。后悔让&lt;span lang=EN-US&gt;Veritas&lt;/span&gt;的人走得太早了，既然人都走了，那么只好自己来整了。在几次反复不同的尝试之后，终于&lt;span lang=EN-US&gt;NBU&lt;/span&gt;可以认到带库了，赶紧配置好。接下开始测试&lt;span lang=EN-US&gt;ORACLE&lt;/span&gt;备份，又报错了：&lt;span lang=EN-US&gt;Ora-27211 &amp;quot;Failed to load Media Management Library&amp;quot;&lt;/span&gt;。又开始折腾了，不停尝试，不停地找解决办法，终于确认应该是&lt;span lang=EN-US&gt;/nbu/openv/netbackup/bin/libobk.so64&lt;/span&gt;这个库文件需要&lt;span lang=EN-US&gt;LINK&lt;/span&gt;一下的。问题是我找不到这个文件呀，突然想起另外一台机器也安装了，过去一看，果然有这文件在，赶紧&lt;span lang=EN-US&gt;COPY&lt;/span&gt;过来，&lt;span lang=EN-US&gt;LINK&lt;/span&gt;一下，可以了！&lt;span lang=EN-US&gt;&lt;/span&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt;text-indent:21pt"&gt;&lt;span style="font-family:宋体"&gt;&lt;font size=2&gt;好不容易整好回家，心情难得高兴一下。短信报错了，这次是因为空间不够，读写打开的备用库的&lt;span lang=EN-US&gt;RESTORE POINT&lt;/span&gt;又没创建起来，这样数据库又无法&lt;span lang=EN-US&gt;FLASHBACK&lt;/span&gt;回去了。那一刻我异常绝望，在经历这么多天高压力的辛劳后，好不容易整起来的东西说出问题就出问题。说啥都没用，上帝有时候就是这样，好在我早已习惯了他老人家的脾气。无论怎样的压力对我来说都是微不足道的，我知道这点。&lt;span lang=EN-US&gt;&lt;/span&gt;&lt;/font&gt;&lt;/span&gt;
&lt;div&gt;&lt;font size=2&gt; &lt;/font&gt;&lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=1357526105754387075&amp;page=RSS%3a+%e7%a5%b8%e4%b8%8d%e5%8d%95%e8%a1%8c&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=blue-prince.spaces.live.com&amp;amp;GT1=blue-prince"&gt;</description><comments>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!847.entry#comment</comments><guid isPermaLink="true">http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!847.entry</guid><pubDate>Tue, 21 Aug 2007 16:00:39 GMT</pubDate><slash:comments>3</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://blue-prince.spaces.live.com/blog/cns!12D6E6CCFACF4283!847/comments/feed.rss</wfw:commentRss><wfw:comment>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!847.entry#comment</wfw:comment><dcterms:modified>2007-08-21T16:00:39Z</dcterms:modified></item><item><title>我只是很平静</title><link>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!836.entry</link><description>&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;font size=2&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;span style=""&gt;    &lt;/span&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;和以往一样，无论在碰到什么样疑难的技术问题之前，我都坚信问题一定能够解决的。只是在好奇着接下到底会碰到什么样的困难，自己会采用什么样的方式进行处理，这次也不例外。&lt;span lang=EN-US&gt;&lt;/span&gt;&lt;/span&gt;&lt;/font&gt;
&lt;p style="margin:0cm 0cm 0pt;text-indent:21.75pt"&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;就在上周末，运行稳定长达&lt;span lang=EN-US&gt;7&lt;/span&gt;个月之久的备用库读写打开出现&lt;span lang=EN-US&gt;600&lt;/span&gt;&lt;/span&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;[krff_create_fb_log-4]&lt;/span&gt;&lt;span style="font-family:宋体"&gt;错误&lt;/span&gt;&lt;span style="font-family:宋体"&gt;，&lt;/span&gt;&lt;span style="font-family:宋体"&gt;导致&lt;/span&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;restore point&lt;/span&gt;&lt;span style="font-family:宋体"&gt;没有创建成功，接下就把&lt;span lang=EN-US&gt;STANDBY&lt;/span&gt;激活读写打开了。由于&lt;span lang=EN-US&gt;RESTORE POINT&lt;/span&gt;没有创建，这样数据库再也无法&lt;span lang=EN-US&gt;FLASHBACK&lt;/span&gt;回去了（写到这个时候，我突然间想起来就算是&lt;span lang=EN-US&gt;RESTORE POINT&lt;/span&gt;没有创建成功，&lt;span lang=EN-US&gt;FALSHBACK&lt;/span&gt;功能打开的话，其实只要&lt;span lang=EN-US&gt;FLASHBACK&lt;/span&gt;到&lt;span lang=EN-US&gt;STANDBY&lt;/span&gt;数据库激活打开之前的时间点，然后重新进行恢复即可，用不着费了我这么多天的辛劳。当然这个还需要测试验证，毕竟现在已经无法这么做了。只恨自己前几天在想着各种各样不同的解决办法，唯独没有想到这种办法，而在我坐下来平静总结的时候却闪出来了）。当时想起来唯一的解决办法只能是重新配置&lt;span lang=EN-US&gt;STANDBY&lt;/span&gt;。问题是这个数据库已经有近&lt;span lang=EN-US&gt;5&lt;/span&gt;个&lt;span lang=EN-US&gt;T&lt;/span&gt;之大，每天大概产生&lt;span lang=EN-US&gt;300G&lt;/span&gt;的归档日志，配置&lt;span lang=EN-US&gt;STANDBY&lt;/span&gt;的工作量可想而知。虽然磁带上有每周一次的全库备份和每天的归档备份，不过如果从磁带恢复的话，那么估计没有十天半个月数据库是无法&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;出来的。这样只能重新备份主库到磁盘上了，问题是存储没有这么大的空间。于是开始规划备份的空间，想到的办法就是先备份数据库到一个目录&lt;span lang=EN-US&gt;/u02/backup&lt;/span&gt;下，然后通过&lt;span lang=EN-US&gt;NFS&lt;/span&gt;再&lt;span lang=EN-US&gt;MOVE&lt;/span&gt;不同备份文件到不同机器的存储上面，最后再通过&lt;span lang=EN-US&gt;LINK&lt;/span&gt;的方式把备份文件&lt;span lang=EN-US&gt;LINK&lt;/span&gt;到&lt;span lang=EN-US&gt;STANDBY&lt;/span&gt;相应的&lt;span lang=EN-US&gt;/u02/backup&lt;/span&gt;上，这样&lt;span lang=EN-US&gt;STANDBY&lt;/span&gt;进行恢复的时候什么都不用更改，可以直接恢复。说干就干，第一个问题出来了，本来我是想主库上的备份&lt;span lang=EN-US&gt;mount point /u02&lt;/span&gt;做为&lt;span lang=EN-US&gt;NFS MOUNT&lt;/span&gt;给备用库的&lt;span lang=EN-US&gt;/u02&lt;/span&gt;，结果由于之前一个子目录&lt;span lang=EN-US&gt;/u02/test/&lt;/span&gt;已经&lt;span lang=EN-US&gt;MOUNT&lt;/span&gt;成&lt;span lang=EN-US&gt;NFS&lt;/span&gt;供多台服务器使用，父目录要想再做成&lt;span lang=EN-US&gt;NFS&lt;/span&gt;是不行的，于是只好在父目录下子文件夹&lt;span lang=EN-US&gt;backup&lt;/span&gt;单独&lt;span lang=EN-US&gt;MOUNT&lt;/span&gt;给&lt;span lang=EN-US&gt;STANDBY&lt;/span&gt;使用。第一个问题解决完后便是丢在那边让数据库慢慢备份了。&lt;span lang=EN-US&gt;&lt;/span&gt;&lt;/span&gt;&lt;/font&gt;
&lt;p style="margin:0cm 0cm 0pt;text-indent:21.75pt"&gt;&lt;span style="font-family:宋体"&gt;&lt;font size=2&gt;主库从中午&lt;span lang=EN-US&gt;11&lt;/span&gt;点到晚上&lt;span lang=EN-US&gt;11&lt;/span&gt;点半左右终于全库备份完了，于是重新配置&lt;span lang=EN-US&gt;STANDBY&lt;/span&gt;，&lt;span lang=EN-US&gt;RESTORE DATABASE&lt;/span&gt;的时候出问题了，死活无法&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;。由于数据库是采用祼设备，为了管理维护的方便，把祼设备&lt;span lang=EN-US&gt;LINK&lt;/span&gt;成文件系统上的虚拟数据文件。于是怀疑是祼设备的问题，先把&lt;span lang=EN-US&gt;600&lt;/span&gt;多个祼设备的全部&lt;span lang=EN-US&gt;DD&lt;/span&gt;清空掉（其实这个&lt;span lang=EN-US&gt;DD&lt;/span&gt;没弄好，今天才发现问题，不过没有影响），再次&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;，还是不行。&lt;span lang=EN-US&gt;OK&lt;/span&gt;，全库&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;不行，那就单独一个表空间吧：&lt;span lang=EN-US&gt;&lt;/span&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt;text-indent:21.75pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt; &lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;RMAN&amp;gt; restore tablespace system;&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt; &lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;Starting restore at 12-AUG-07&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;using channel ORA_DISK_1&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt; &lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;creating datafile fno=1 name=/u01/oracle/oradata/test/system01.dbf&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;RMAN-00571: ===========================================================&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;RMAN-00569: =============== ERROR MESSAGE STACK FOLLOWS ===============&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;RMAN-00571: ===========================================================&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;RMAN-03002: failure of restore command at 08/12/2007 2:20:20&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;ORA-01180: can not create datafile 1&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;ORA-01110: data file 1: '/u01/oracle/oradata/test/system01.dbf'&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt; &lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span style="font-family:宋体"&gt;&lt;font size=2&gt;系统表空间不行，那就试试其他表空间吧：&lt;span lang=EN-US&gt;&lt;/span&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt; &lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;RMAN&amp;gt; restore tablespace sysaux;&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;Starting restore at 12-AUG-07 using target database control file instead of recovery catalog &lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;allocated channel: ORA_DISK_1 channel ORA_DISK_1: sid=1094 devtype=DISK &lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;creating datafile fno=3 name=/u01/oracle/oradata/test/sysaux01.dbf &lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt"&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;&lt;font size=2&gt;restore not done; all files readonly, offline, or already restored Finished restore at 12-AUG-07&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt;text-indent:21pt"&gt;&lt;span style="font-family:宋体"&gt;&lt;font size=2&gt;折腾了&lt;span lang=EN-US&gt;N&lt;/span&gt;遍之后，结果死活都是&lt;span lang=EN-US&gt;restore not done&lt;/span&gt;，看看都凌晨&lt;span lang=EN-US&gt;2&lt;/span&gt;点半了，先睡觉吧，等第二天再问同事看看之前有没碰过类似的问题。&lt;span lang=EN-US&gt;&lt;/span&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt;text-indent:21pt"&gt;&lt;span style="font-family:宋体"&gt;&lt;font size=2&gt;周日早上一醒来便打电话问&lt;span lang=EN-US&gt;piner&lt;/span&gt;之前有没碰到类似的问题，结果他也没碰到过，他折腾了几下发现问题比较怪异，也没有好的解决办法。这样只好再试不同的办法了，怀疑是&lt;span lang=EN-US&gt;LV&lt;/span&gt;的问题，于是把&lt;span lang=EN-US&gt;LV&lt;/span&gt;删掉重建并重新&lt;span lang=EN-US&gt;LINK&lt;/span&gt;好，再&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;，还是不行（刚才测试后才发现&lt;span lang=EN-US&gt;LV&lt;/span&gt;重建的话，只要建的方式跟之前的一样，里面内容都不会丢失）。怀疑是&lt;span lang=EN-US&gt;RMAN&lt;/span&gt;备份不能通过&lt;span lang=EN-US&gt;LINK&lt;/span&gt;的方式&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;，于是将对应的备份集&lt;span lang=EN-US&gt;COPY&lt;/span&gt;到&lt;span lang=EN-US&gt;/u01/backup&lt;/span&gt;目录，&lt;span lang=EN-US&gt;restore&lt;/span&gt;还是不行。实在没辙了，上集团&lt;span lang=EN-US&gt;DBA&lt;/span&gt;群问在线的同事，不过也都没有好的解决办法，&lt;span lang=EN-US&gt;BITI&lt;/span&gt;后面说实在不行就用&lt;span lang=EN-US&gt;dbms_backup_restore&lt;/span&gt;包一个个数据文件整好了。我晕，一共有&lt;span lang=EN-US&gt;600&lt;/span&gt;多个数据文件，&lt;span lang=EN-US&gt;2600&lt;/span&gt;多个备份文件呀！还是先再想想有没别的办法，既然&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;到祼设备不行，那么试着&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;到文件系统行不。发现&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;到文件系统是可以的，虽然信息还是跟之前的一样&lt;span lang=EN-US&gt;:restore not done&lt;/span&gt;，不过文件系统上确实是有数据文件了（后面发现其实是不行的）。不过总不能一个个数据文件&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;到文件系统然后再&lt;span lang=EN-US&gt;DD&lt;/span&gt;到祼设备吧。&lt;span lang=EN-US&gt;&lt;/span&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt;text-indent:21pt"&gt;&lt;span style="font-family:宋体"&gt;&lt;font size=2&gt;家里网络环境不好，跑到公司去整，结果到公司折腾了几下还是没有找到好的办法。由于没有休息好，实在困得不行，只好先回家休息。回到家也没休息好，眯了一下突然间想起来既然&lt;span lang=EN-US&gt;SYSTEM&lt;/span&gt;表空间用&lt;span lang=EN-US&gt;RMAN&lt;/span&gt;无法&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;，那么可以先使用&lt;span lang=EN-US&gt;dbms_backup_restore&lt;/span&gt;包&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;到文件系统，再从文件系统&lt;span lang=EN-US&gt;DD&lt;/span&gt;到祼设备。费了九牛二虎之力终于整好&lt;span lang=EN-US&gt;SYSTEM&lt;/span&gt;表空间。接下便想起来早上&lt;span lang=EN-US&gt;RESTORE SYSAUX&lt;/span&gt;到文件系统的时候，虽然说&lt;span lang=EN-US&gt;restore not done&lt;/span&gt;，但是确实是在文件系统上产生了数据文件，而且大小一样。这样看来虽然&lt;span lang=EN-US&gt;RMAN&lt;/span&gt;提示说&lt;span lang=EN-US&gt;restore not done&lt;/span&gt;，但是应该是已经&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;好了，这个提示可以忽略不计。这样想之后就开始分头写脚本&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;不同的表空间，一开始是把&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;所有剩余表空间的语句放在一个脚本里面运行。跑了一会想起效率太低，应该并行跑不同脚本&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;不同的表空间，杀掉重跑，以使&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;最快。运行了很长很长时间后又发现其他表空间都&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;好了，一个最大有着&lt;span lang=EN-US&gt;300&lt;/span&gt;个数据文件的表空间还在慢慢的&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;，于是中止重来，把这个表空间剩余未&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;好的数据文件分配到不同的进程再次&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;。&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;一半时发现有些&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;失败了，由于周日正好是对备用库进行全库备份，结果控制文件&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;的时候跑去磁带找备份集了。分配的通道是&lt;span lang=EN-US&gt;DISK&lt;/span&gt;的，这样当然不行了。只能是重新在主库上生成控制文件，再&lt;span lang=EN-US&gt;DD&lt;/span&gt;进去。我不知道这几天重复着多少次这样&lt;span lang=EN-US&gt;DD&lt;/span&gt;的过程。在&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;的过程中心情异常地平静，我想这次如果成功了我不会像以往每次解决疑难问题后那么欣喜，我只会很平静地告诉自己算是折腾好了。实在是太累了！&lt;span lang=EN-US&gt;&lt;/span&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt;text-indent:21pt"&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;脚本跑起来之后人也没闲着，总不能把希望全部寄托在这上面吧，万一这样&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;不行咋办？只能想到最后的办法：用&lt;span lang=EN-US&gt;dbms_backup_restore&lt;/span&gt;包进行手工&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;，于是在边上准备好脚本，一共将近&lt;span lang=EN-US&gt;3000&lt;/span&gt;多行，壮观！&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;还在慢慢的运行过程中，看到都凌晨&lt;span lang=EN-US&gt;2&lt;/span&gt;点多了，想着放在那边慢慢&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;，第二天早上再起来整。结果躺在床上虽然很累却是睡不着，起来看了一下发现只剩下不多的数据文件需要&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;了，干脆折腾好吧。在&lt;span lang=EN-US&gt;3&lt;/span&gt;点半左右的时候终于全部数据文件&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;好了，于是开始&lt;span lang=EN-US&gt;recover managed standby&lt;/span&gt;，命令一下来就出错：&lt;/span&gt;&lt;span lang=EN-US style="font-family:宋体"&gt; ORA-19909: datafile 1 belongs to an orphan incarnation&lt;/span&gt;&lt;span style="font-family:宋体"&gt;。百思不得其解，&lt;span lang=EN-US&gt;SYSTEM&lt;/span&gt;我可是&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;到文件系统上并且&lt;span lang=EN-US&gt;DD&lt;/span&gt;到祼设备的，再怎么着出问题也不可能会是&lt;span lang=EN-US&gt;SYSTEM&lt;/span&gt;出问题呀！想想可能还是&lt;/span&gt;&lt;span lang=EN-US style="font-family:宋体"&gt;restore not done&lt;/span&gt;&lt;span style="font-family:宋体"&gt;的原因，可能没&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;好吧。既然脚本都准备好了，就用&lt;span lang=EN-US&gt;dbms_backup_restore&lt;/span&gt;来整吧，发现一个脚本太多行数无法执行。&lt;span lang=EN-US&gt;OK&lt;/span&gt;，那分脚本来执行吧，由于不知道哪些数据文件在哪些备份集上，只能把所有备份集都选上，还是由于太多行不能执行。这样我实在没辙了，总不能让我一个个数据文件对应的备份集找出来弄好脚本再去执行吧。看看都凌晨&lt;span lang=EN-US&gt;4&lt;/span&gt;点了，第二天就周一，到公司上班后再整吧。&lt;span lang=EN-US&gt;&lt;/span&gt;&lt;/span&gt;&lt;/font&gt;
&lt;p style="margin:0cm 0cm 0pt;text-indent:21pt"&gt;&lt;span style="font-family:宋体"&gt;&lt;font size=2&gt;周一中午到公司后发现汪海已经在折腾了。这次他&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;完一次就是去&lt;span lang=EN-US&gt;DUMP&lt;/span&gt;数据文件头看看，发现昨天那样&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;是压根都没成功的，数据文件头的状态全部不对。更奇怪的是我&lt;span lang=EN-US&gt;SYSTEM&lt;/span&gt;表空间是&lt;span lang=EN-US&gt;DD&lt;/span&gt;到祼设备的，居然还是不行。我们在不停地尝试不同的方法，方方面面可能的问题都想过了，不停地&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;不停地&lt;span lang=EN-US&gt;DUMP&lt;/span&gt;查看，还是没有找到可行的办法。最后面还是发现用&lt;span lang=EN-US&gt;dbms_backup_restore&lt;/span&gt;是可行的，&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;完后&lt;span lang=EN-US&gt;DUMP&lt;/span&gt;数据文件头出来的状态是正确的。这样只能用到最后这一招了，到时候写个&lt;span lang=EN-US&gt;SHELL&lt;/span&gt;脚本去生成&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;的脚本吧。这时候归档已经积累快&lt;span lang=EN-US&gt;3&lt;/span&gt;天了，估计恢复也够呛。而且之前的控制文件由于测试的过程中不断地备份，可能备份信息都乱了。于是决定重头开始备份，&lt;span lang=EN-US&gt;RMAN&lt;/span&gt;既然出问题，就等备份完后把主库的&lt;span lang=EN-US&gt;rman&lt;/span&gt;可执行文件&lt;span lang=EN-US&gt;COPY&lt;/span&gt;到备用库试试吧。备份速度比预想中的要快很多，昨晚又是不停地移动备份集到不同的目录，中间又是出这个问题那个问题，整到凌晨&lt;span lang=EN-US&gt;3&lt;/span&gt;点多才好。&lt;span lang=EN-US&gt;&lt;/span&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p style="margin:0cm 0cm 0pt;text-indent:21pt"&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;今天到公司后先把主库的&lt;span lang=EN-US&gt;rman&lt;/span&gt;程序&lt;span lang=EN-US&gt;COPY&lt;/span&gt;到备用库，然后调用起来&lt;span lang=EN-US&gt;RESTORE SYSAUX&lt;/span&gt;表空间，乖乖，居然可以了！于是赶紧全库&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;。看着&lt;span lang=EN-US&gt;RMAN&lt;/span&gt;在慢慢的&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;，一下子舒了一口气，连续折腾了&lt;span lang=EN-US&gt;4&lt;/span&gt;天&lt;span lang=EN-US&gt;3&lt;/span&gt;夜终于有结果了。我没有太多的惊喜，只是终于解决了这个问题而已。现在这样看来应该是备库上&lt;span lang=EN-US&gt;RMAN&lt;/span&gt;程序的问题，不过我还是认为应该不是这个问题，因为这个&lt;span lang=EN-US&gt;RMAN&lt;/span&gt;程序备份了一年都没问题，不可能&lt;span lang=EN-US&gt;RESTORE&lt;/span&gt;就出错。不过事实确实就是这样，那么应该就是这个问题吧。&lt;/span&gt; &lt;/font&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=1357526105754387075&amp;page=RSS%3a+%e6%88%91%e5%8f%aa%e6%98%af%e5%be%88%e5%b9%b3%e9%9d%99&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=blue-prince.spaces.live.com&amp;amp;GT1=blue-prince"&gt;</description><comments>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!836.entry#comment</comments><guid isPermaLink="true">http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!836.entry</guid><pubDate>Tue, 14 Aug 2007 14:12:01 GMT</pubDate><slash:comments>7</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://blue-prince.spaces.live.com/blog/cns!12D6E6CCFACF4283!836/comments/feed.rss</wfw:commentRss><wfw:comment>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!836.entry#comment</wfw:comment><dcterms:modified>2007-08-14T14:12:01Z</dcterms:modified></item><item><title>我承认是人品问题</title><link>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!663.entry</link><description>&lt;div&gt;
&lt;p&gt;&lt;span style="font-family:宋体"&gt;&lt;font size=2&gt;记录一下接手这个数据库后硬件出故障的记录吧（写工作周报的好处这时候体现出来了，想知道什么时候做过什么事情都可以查）：&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman" size=2&gt;6&lt;/font&gt;&lt;/span&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;月份：备用库存储&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;SP&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;报错损坏，去机房更换备用库&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;SP&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;。&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;8.15&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;：备用库存储另外一个&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;SP&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;损坏，厂商拿着新换的&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;SP&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;过来，结果居然新拿的&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;SP&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;也是坏的，厂商不得不当天从上海再调一个&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;SP&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;过来，上下午各往返一次机房把&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;SP&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;换好。&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;8.29&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;：备用库存储上一个硬盘损坏，再次机房更换硬盘。&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;9.1&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;：去机房测试备用库网卡出错。这个备用库原来是做为主库用的，结果在使用过程中经常出现莫名其妙的数据传输乱码，比如你传的数据是“&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;12345&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;”&lt;/span&gt;&lt;span style="font-family:宋体"&gt;，接收后会变成“&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;ABCDE&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;”，这个数据库原先是&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;piner&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;负责的，他当时怀疑网络原因，怀疑存储原因，怀疑&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;OS&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;……经过&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;N&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;久的测试后，最终才定位到是网卡问题，估计是主芯片问题，把数据传输成乱码。这块网卡是由两块网卡绑定而成的，把绑定网卡解开，一块网卡一块网卡测试，定位出出错的网卡。&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;9.6&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;：主库一块光纤卡损坏，去机房更换，把存储停掉，费了不少周折。其实这时候主库也报了个同备用库后面报的同样的电源错误，不过只是启动后报了一次，没当回事。&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;9.7&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;：经销商过来更换备用库损坏的网卡，拿来的一块网卡居然也是坏的，这次还好，经销商在杭州有办事处，不用从上海调货了，在机房等着新网卡更换，网卡最终顺利更换完成。不过服务器启动后报了一个莫名其妙的错误&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;: sysplanar0&lt;span&gt;     &lt;/span&gt;UNDETERMINED ERROR&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;，具体出错信息如下：&lt;/span&gt;&lt;/font&gt;&lt;span lang=EN-US&gt;&lt;span&gt;&lt;font face="Times New Roman" size=2&gt; &lt;/font&gt;&lt;/span&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman" size=2&gt;Diagnostic Log sequence number: 11252&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman" size=2&gt;Resource tested:&lt;span&gt;        &lt;/span&gt;sysplanar0&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman" size=2&gt;Resource Description:&lt;span&gt;   &lt;/span&gt;System Planar&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;&lt;font size=2&gt;Location:&lt;span&gt;       &lt;/span&gt;&lt;span&gt;        &lt;/span&gt;&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman" size=2&gt;SRC:&lt;span&gt;                    &lt;/span&gt;11001520&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman" size=2&gt;Description:&lt;span&gt;            &lt;/span&gt;Power/Cooling subsystem Unrecovered Error, bypassed&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;&lt;font size=2&gt;&lt;span&gt;                        &lt;/span&gt;with loss of redundancy. Refer to the system service&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;&lt;font size=2&gt;&lt;span&gt;                        &lt;/span&gt;documentation for more information.&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman" size=2&gt;Additional Words:&lt;span&gt;       &lt;/span&gt;2-003C0001 3-00000000 4-00000000 5-00000000&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;&lt;font size=2&gt;&lt;span&gt;                        &lt;/span&gt;6-00000000 7-00000000 8-00000000 9-00000000&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman" size=2&gt;Possible FRUs:&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;&lt;font size=2&gt;&lt;span&gt;    &lt;/span&gt;Priority: L FRU: PWRSPLY &lt;/font&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;&lt;font size=2&gt;&lt;span&gt;    &lt;/span&gt;Location: U787B.001.DNW764F&lt;/font&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;&lt;font size=2&gt;&lt;span&gt;    &lt;/span&gt;Priority: L FRU: 03N6961&lt;span&gt;  &lt;/span&gt;S/N: YL10HA5C609L CCIN: 28D9 &lt;/font&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman" size=2&gt;Location: U787B.001.DNW764F-P1&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman" size=2&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;打&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;IBM800&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;电话说有可能是主板或者电源的问题，说由于服务器的信息跟他们的服务中心没有同步好，&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;IBM&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;不负责保修。只好联系经销商，经销商答应换电源。&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;还有一项任务是把备用库上的&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;CPU&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;和内存各拔一半到主库上用。结果服务器拆下来后发现服务器是较早买的型号，两块板都只有&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;2&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;个&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;CPU&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;插槽，已经插满了，无法升级，早就预定的升级最终无法完成。&lt;br&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;9.12&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;：经销商派了个工程师过来更换备用库的电源。到达机房后，那哥们不知道换哪个电源，我只好随便挑了右边的一个电源进行更换。重启后报错依旧。&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;9.21&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;：经销商另外派了一个资深的工程师来机房查看错误，把备用库的服务器拆下来一个零件一个零件查看一遍，再装上去错误依旧，那哥们说看来是主板有问题。问经销商服务器信息同步好了没有，说已经同步好，现在&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;IBM&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;可以保修了。回去以后打&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;800&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;电话说还是没同步好，不受理保修。&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;10.10&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;：经销商工程师过来备用库配件，原先以为会过来换主板，结果居然是拿了&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;8&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;根内存过来换。他们的解释说现在也不知道到底问题出在哪里，那个报错信息只是说可能是主板或电源有问题，电源已经换了一个，现在把配件一个个换掉试试看有没问题，还会不会报错。由于更换主板需要从国外调货，他们一时还无法更换。他们还要更换网卡，我不让换，说现在网卡好好的，没必要再换了。服务器一个板上的&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;8&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;根内存全部更换完毕后报错依旧，经销商工程师说看来只能更换主板了。回公司后发现居然网卡也报错了。&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;10.11&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;：去机房检查备用库网卡出错信息，搞定。&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;10.18&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;：经销商这次终于过来换主板了，连着把全部&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;16&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;根内存和&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;2&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;块网卡再换了个遍。本来以为很顺利的更换过程换了将近&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;3&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;个小时才换好，将近&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;3&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;点才吃午饭。本来想这样大换血后总不会出问题了吧，结果错误依旧。其中换硬件过程中接了个&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;USB&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;鼠标没有驱动程序无法使用，服务器不时接到短信报警，半夜被短信吵醒。经销商确认现在服务器配置已经和&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;IBM&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;同步完成，可以原厂保修了。&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;10.19&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;：联系&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;IBM 800&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;报修，终于答应派一个本地工程师上门服务。&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;10.20&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;：同&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;IBM&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;工程师去机房诊断备用库错误信息。&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;IBM&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;工程师经过多次诊断后得出结论是第一个电源有问题，也就是左边的那个电源。理由是报错信息中的&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;Location: U787B.001.DNW764F-P1&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;中的这个&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;001&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;是表示第一个位置。得出结论后回来跟&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;TEAM&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;里面的人说，大家都笑了，想不到经过这么多次折腾，把机器的配件换了个遍，假如最早那次经销商换电源时换的是左边那个电源就好了，也就不会折腾到现在。问题找到原因，终于可以舒一口气了。&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;10.23&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;：&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;IBM&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;工程师拿着新电源过来换，把左边那个电源更换重启后发现报错居然依旧。这次真&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;TMD&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;是活见鬼了，&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;IBM&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;的工程师用手在电源背面板不断地试，还和主库上比较，接下决定一个电源一个电源来测试，测试发现有一路电源是无法启动的，既然两个电源都已经换过了，电源出问题的可能性太小了，会不会是电源线或者其他问题？把电源线换了一个插座插好后启动了。靠&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;TMD&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;！原来是机柜上插电源的那个插头坏了，因此始终报错。亏我们还一共换了&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;24&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;根内存、&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;3&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;块网卡、&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;1&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;块主板、&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;2&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;个电源，就是换一台全新的机器也还是会报错！也就是说之前折腾了那么久，换了那么多配件做的都是无用功！换了个电源插头插上去，终于好了！搞定一个大问题后长舒了一口气。结果在启动后发现绑定网卡又出问题了，只好取消绑定，用单块网卡使用。&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;10.24&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;：由于前一天更换电源后接了个&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;USB&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;键盘没能认出，备用库又不时报&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;USB&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;驱动错误，为了避免半夜被监控短信吵醒，只好到机房把备用库断电重启以消除报错顺便解决一下网卡问题。处理过程中犯了大错。网卡换线换端口还是有问题，实在经不起折腾了，只好继续用单网卡使用。测试了一下插头电源，发现机柜左边一排插头中居然有两个插头是坏的！这垃圾工程！&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;span style="font-family:宋体"&gt;&lt;font size=2&gt;现在：主库的冗余电源需要确认到底是电源问题还是像以前那样的插头没电引起的；主库存储又开始报错了，原因不明，需要进一步跟踪；备库网卡还需要挑个时间过去看一下具体出错所在……&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;Wanghai&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;和&lt;/span&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;piner&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;开玩笑说是我人品不好，因此服务器硬件才会三天两头出问题。好吧，我承认是我人品不行，只是求求我的好服务器千万不要再出问题了，机房的地板已经被我坐得厚度都少了几毫米了。千万千万不要再半夜收到监控短信了，你知道我睡眠不好的，你知道我长期失眠的，你就让我睡个安稳觉吧！&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;font face="Times New Roman"&gt;10&lt;/font&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;月是我的滑铁卢，快过去了，都会好起来的！&lt;/span&gt;&lt;/font&gt;&lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=1357526105754387075&amp;page=RSS%3a+%e6%88%91%e6%89%bf%e8%ae%a4%e6%98%af%e4%ba%ba%e5%93%81%e9%97%ae%e9%a2%98&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=blue-prince.spaces.live.com&amp;amp;GT1=blue-prince"&gt;</description><comments>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!663.entry#comment</comments><guid isPermaLink="true">http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!663.entry</guid><pubDate>Wed, 25 Oct 2006 15:01:13 GMT</pubDate><slash:comments>2</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://blue-prince.spaces.live.com/blog/cns!12D6E6CCFACF4283!663/comments/feed.rss</wfw:commentRss><wfw:comment>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!663.entry#comment</wfw:comment><dcterms:modified>2006-11-02T15:48:11Z</dcterms:modified></item><item><title>昨天犯大错了</title><link>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!662.entry</link><description>&lt;div&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;昨天下午去机房解决备用库报错的问题。在处理过程中，监控主库的错误信息发现居然之前报过同&lt;/span&gt;&lt;span style="font-family:宋体"&gt;备用库&lt;/span&gt;&lt;span style="font-family:宋体"&gt;一模一样的电源错误：&lt;/span&gt;&lt;span lang=EN-US style="font-family:Arial"&gt;&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;span lang=EN-US style="font-size:9pt;font-family:Arial"&gt;&lt;font size=2&gt;&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span lang=EN-US style="font-size:9pt;font-family:Arial"&gt;Description:           &lt;/span&gt;&lt;b&gt;&lt;span lang=EN-US style="color:red;font-family:Arial"&gt; Power/Cooling subsystem Unrecovered Error, bypassed&lt;/span&gt;&lt;/b&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;b&gt;&lt;span lang=EN-US style="color:red;font-family:Arial"&gt;with loss of redundancy.&lt;/span&gt;&lt;/b&gt;&lt;span lang=EN-US style="font-size:9pt;font-family:Arial"&gt; Refer to the system service&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;span lang=EN-US style="font-size:9pt;font-family:Arial"&gt;&lt;font size=2&gt;                        documentation for more information.&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US style="font-size:9pt;font-family:Arial"&gt;&lt;font size=2&gt;Additional Words:       2-003C0001 3-00000000 4-00000000 5-00000000&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US style="font-size:9pt;font-family:Arial"&gt;&lt;font size=2&gt;                        6-00000000 7-00000000 8-00000000 9-00000000&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US style="font-size:9pt;font-family:Arial"&gt;&lt;font size=2&gt;Possible FRUs:&lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;span lang=EN-US style="font-size:9pt;font-family:Arial"&gt;&lt;font size=2&gt;    Priority: L FRU: PWRSPLY &lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span lang=EN-US style="font-size:9pt;font-family:Arial"&gt;    Location: U787B.&lt;/span&gt;&lt;b&gt;&lt;span lang=EN-US style="font-size:12pt;color:red;font-family:Arial"&gt;001&lt;/span&gt;&lt;/b&gt;&lt;span lang=EN-US style="font-size:9pt;font-family:Arial"&gt;.DNW764F&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;span lang=EN-US style="font-size:9pt;font-family:Arial"&gt;&lt;font size=2&gt;    Priority: L FRU: 03N6961  S/N: YL10HA5C609L CCIN: 28D9 &lt;/font&gt;&lt;/span&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span lang=EN-US style="font-size:9pt;font-family:Arial"&gt;Location: U787B.&lt;/span&gt;&lt;b&gt;&lt;span lang=EN-US style="font-size:12pt;color:red;font-family:Arial"&gt;001&lt;/span&gt;&lt;/b&gt;&lt;span lang=EN-US style="font-size:9pt;font-family:Arial"&gt;.DNW764F-P1&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;这个错误之前备用库也曾出现过，并花了将近两个多月的时间才知道具体症结所在。&lt;/span&gt;&lt;span lang=EN-US style="font-family:Arial"&gt;location 001 &lt;/span&gt;&lt;span style="font-family:宋体"&gt;上次&lt;/span&gt;&lt;span lang=EN-US style="font-family:Arial"&gt;IBM&lt;/span&gt;&lt;span style="font-family:宋体"&gt;的工程师介绍说（这个错误的说法害死人！）是表示第一个电源出问题，于是我用手去摸&lt;/span&gt;&lt;span style="font-family:宋体"&gt;主库和备用库&lt;/span&gt;&lt;span style="font-family:宋体"&gt;共&lt;/span&gt;&lt;span lang=EN-US style="font-family:Arial"&gt;4&lt;/span&gt;&lt;span style="font-family:宋体"&gt;个电源比较，发现主库第一个电源背板明显热量比其他电源大，当时和拖雷联系认为是主库的第一个电源出现问题了，根据机器报错信息（&lt;span lang=EN-US&gt;IBM&lt;/span&gt;工程师提供的信息）和我现场实际检测（热量明显比其他电源大）都说明了这个问题。由于服务器的两个电源是互相冗余的，既然这个电源有问题，那么当时和拖雷一起肯定另外一个电源是正常工作的，可以把这个电源拔下来看看到底故障出在哪里。接下来的事情就玩大了：&lt;/span&gt;&lt;span style="font-family:宋体"&gt;我拔了这根电源线，运行中的主库马上断电宕机……看了后面板的灯全灭了，我当时立马傻了，愣在那边！幸好这个数据库是内部使用的数据库，&lt;/span&gt;&lt;span style="font-family:宋体"&gt;幸好当时用户很少，幸好当时没有什么事务，服务器重启动后数据库也很顺利地起来了。虽然这个数据库对可靠性要求不像生产数据库要求那么高，不过对于一个&lt;span lang=EN-US&gt;DBA&lt;/span&gt;来说那一个时刻绝对是难于忘怀的。我想我一辈子都不会忘记拔掉服务器电源后背板灯全灭的那一刻！&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;&lt;/span&gt;&lt;/font&gt;&lt;font size=2&gt;&lt;span style="font-family:宋体"&gt;事后回想，要么就是&lt;/span&gt;&lt;span lang=EN-US style="font-family:Arial"&gt;IBM&lt;/span&gt;&lt;span style="font-family:宋体"&gt;工程师说的这个&lt;/span&gt;&lt;span lang=EN-US style="font-family:Arial"&gt;location 001&lt;/span&gt;&lt;span style="font-family:宋体"&gt;指的是第一个电源有误，要么就是&lt;/span&gt;&lt;span lang=EN-US style="font-family:Arial"&gt;IBM&lt;/span&gt;&lt;span style="font-family:宋体"&gt;的冗余电源无法真正做到热故障切换。早上联系了一下&lt;span lang=EN-US&gt;IBM&lt;/span&gt;的&lt;span lang=EN-US&gt;800&lt;/span&gt;果然说这个&lt;/span&gt;&lt;span lang=EN-US style="font-family:Arial"&gt;location 001&lt;/span&gt;&lt;span style="font-family:宋体"&gt;并不是指第一个电源，根据当时现场诊断发热量过大的判断，那个电源应该是正常工作的，而另一个没什么发热的电源基本上可以肯定没有正常工作的，或者就是服务器的冗余电源无法真正实现热切换。&lt;/span&gt;&lt;span lang=EN-US style="font-family:Arial"&gt;&lt;/span&gt;&lt;/font&gt;
&lt;p&gt;&lt;font size=2&gt;&lt;span lang=EN-US&gt;&lt;span&gt;&lt;font face="Times New Roman"&gt;       &lt;/font&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="font-family:宋体"&gt;在去年十月也曾经犯过错误，十月是我的滑铁卢。&lt;/span&gt;&lt;/font&gt;&lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=1357526105754387075&amp;page=RSS%3a+%e6%98%a8%e5%a4%a9%e7%8a%af%e5%a4%a7%e9%94%99%e4%ba%86&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=blue-prince.spaces.live.com&amp;amp;GT1=blue-prince"&gt;</description><comments>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!662.entry#comment</comments><guid isPermaLink="true">http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!662.entry</guid><pubDate>Wed, 25 Oct 2006 15:00:13 GMT</pubDate><slash:comments>2</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://blue-prince.spaces.live.com/blog/cns!12D6E6CCFACF4283!662/comments/feed.rss</wfw:commentRss><wfw:comment>http://blue-prince.spaces.live.com/Blog/cns!12D6E6CCFACF4283!662.entry#comment</wfw:comment><dcterms:modified>2006-10-25T15:07:50Z</dcterms:modified></item></channel></rss>