LR结果分析

一.为什么Windows系统中的CPU、内存等资源仍然充足，但是模拟的用户数量却上不去?

　　在Windows计算机的标准设置下，操作系统的默认限制只能使用几百个Vuser，这个限制与CPU或内存无关，主要是操作系统本身规定了默认的最大线程数所导致。要想突破Windows这个限制，须修改Windows注册表。以Windows XP Professional为例。

　　(1)打开注册表后，进入注册表项HKEY_LOCAL_MACHINE中的下列关键字：SystemCurrentControlSetControlSession ManagerSubSystems。

　　(2)找到Windows关键字，Windows关键字如下所示：

　　%SystemRoot%system32csrss.exe bjectDirectory=Windows

　　SharedSection=1024,3072,512 Windows=On SubSystemType=Windows ServerDll=basesrv,1

　　ServerDll=winsrv:UserServerDllInitialization,3 ServerDll=winsrv:ConServerDllInitialization,2

　　ProfileControl=Off MaxRequestThreads=16

　　SharedSection=1024,3072,512关键字的格式为xxxx,yyyy,zzz。其中，xxxx定义了系统范围堆的最大值(以KB为单位)，yyyy定义每个桌面堆得大小。

　　(3)将yyyy的设置从3072更改为8192(即8MB)，增加SharedSection参数值。

　　通过对注册表的更改，系统将允许运行更多的线程，因而可以在计算机上运行更多的Vuser。这意味着能够模拟的最大并发用户数量将不受Windows操作系统的限制，而只受硬件和内部可伸缩性限制的约束。

二、connection refused

这个的错误的原因比较复杂，也可能很简单也可能需要查看好几个地方，解决起来不同的操作系统方式也不同。

1、首先检查是不是连接weblogic服务过大部分被拒绝，需要监控weblogic的连接等待情况，此时需要增加acceptBacklog，每次增加25%来提高看是否解决，同时还需要增加连接池和调整执行线程数，（连接池数*Statement Cache Size）的值应该小于等于oracle数据库连接数最大值。

2、如果方法一操作后没有变化，此时需要去查看服务器操作系统中是否对连接数做了限制，AIX下可以直接vi文件limits修改其中的连接限制数、端口数，还有tcp连接等待时间间隔大小，wiodows类似，只不过windows修改注册表，具体修改注册表中有TcpTimedWaitDelay和MaxUserPort项，键值在[HKEY_LOCAL_MACHINESYSTEMCurrentControlSetServicesTcpipParameters]。因为负载生成器的性能太好，发数据包特别快，服务器也响应特别快，从而导致负载生成器的机器的端口在没有timeout之前就全部占满了。在全部占满后，就会出现上面的错误。执行netstat –na命令，可以看到打开了很多端口。所以就调整TCP的time out。即在最后一个端口还没有用到时，前面已经有端口在释放了。

1,这里的TcpTimedWaitDelay默认值应该中是30s，所以这里，把这个值调小为5s（按需要调整）。
2,也可以把MaxUserPort调大（如果这个值不是最大值的话）。

三、open many files

问题一般都在压力较大的时候出现，由于服务器或者应用中间件本身对于打开的文件数有最大值限制造成，解决办法：

1、修改操作系统的文件数限制，aix下面修改limits下的nofiles限制条件，增大或者设置为没有限制，尽量对涉及到的服务器都作修改。

2、方法一解决不了情况下再去查看应用服务器weblogic的commonEnv.sh文件，修改其中的nofiles文件max-nofiles数增大，应该就可以通过了，具体就是查找到nofiles方法，修改其中else条件的执行体，把文件打开数调大。修改前记住备份此文件，防止修改出错。

3、linux上可以通过ulimit –HSn 4096来修改文件打开数限制，也可以通过ulimit -a 来查看。

4、linux上可以通过lsof -p pid | wc -l 来查看进程打开的句柄数。

四、has shut down the connection prematurely

一般是在访问应用服务器时出现，大用户量和小用户量均会出现。

来自网上的解释：

1>应用访问死掉

小用户时：程序上的问题。程序上存在数据库的问题

2>应用服务没有死

应用服务参数设置问题

例如：

在许多客户端连接Weblogic应用服务器被拒绝，而在服务器端没有错误显示，则有可能是Weblogic中的server元素的AcceptBacklog属性值设得过低。如果连接时收到connection refused消息，说明应提高该值，每次增加25％

Java连接池的大小设置，或JVM的设置等

3>数据库的连接

在应用服务的性能参数可能太小了

数据库启动的最大连接数（跟硬件的内存有关）

以上信息有一定的参考价值，实际情况可以参考此类调试。

如果是以上所说的小用户时：程序上的问题。程序上存在数据库的问题，那就必须采用更加专业的工具来抓取出现问题的程序，主要是程序中执行效率很低的sql语句，weblogic可以采用introscope定位，期间可以注意观察一下jvm的垃圾回收情况看是否正常，我在实践中并发500用户和600用户时曾出现过jvm锯齿型的变化，上升下降都很快，这应该是不太正常的。

---------------------------------------

实际测试中，可以用telent 站点看看是否可以连接进去，可以通过修改连接池中的连接数和适当增加应用内存值，问题可以解决。

五、Failed to connect to server

这个问题一般是客户端链接到服务失败，原因有两个客户端连接限制（也就是压力负载机器），一个网络延迟严重，解决办法：

1、修改负载机器注册表中的TcpTimedWaitDelay减小延时和MaxUserPort增加端口数。注：这将增加机器的负荷。

2、检查网络延迟情况，看问题出在什么环节。

建议为了减少这种情况，办法一最好测试前就完成了，保证干净的网络环境，每个负载机器的压力测试用户数不易过大，尽量平均每台负载器的用户数，这样以上问题出现的概率就很小了。

六、Overlapped transmission of request to ... WSA_IO_PENDING

这个问题，解决方法：

1、方法一，在脚本前加入web_set_sockets_option("OVERLAPPED_SEND", "0")，禁用TTFB细分，问题即可解决，但是TTFB细分图将不能再使用，附图。

七、Deleted the current transaction ... since response time is not accurate

这个问题不多遇见，一般出现在压力机器上发生ping值为负数（AMD双核CPU），可以重新启动pc机或者打补丁，附图。

2、方法二，可以通过增加连接池和应用系统的内存，每次增加25%。

八、HTTP Status-Code=500 (Internal Server Error) for

1、应用服务当掉，重新启动应用服务。

2、当应用系统处于的可用内存处于阀值以下时，出现HTTP Status-Code=500的概率非常高，此时只要增加应用系统的内存，问题即可解决。

九、Failed to transmit data to network: [10057]Socket is not connected

这个错误是由网络原因造成的，PC1和PC2上面都装了相同的loadrunner 9.0，且以相同数量的虚拟用户数运行相同的业务（机器上的其他条件都相同），PC1上面有少部分用户报错，PC2上的用户全部执行通过。

十、Error -27257: Pending web_reg_save_param/reg_find/create_html_param[_ex] request(s) detected and reset at the end of iteration number 1
解决方法：web_reg_save_param位置放错了，应该放到请求页面前面。

十一、通过Controler调用远程代理时报错，Error: CCI security error:You are running under secure mode and the function system is not allowed in this mode.
解决方法：在代理开启的时候，去掉勾选防火墙选项。