连接数据库时发生"一般性网络错误"的另类解释

    技术2026-04-07  0

    连接数据库时发生"一般性网络错误"的另类解释

     

    Revision History:

     

    Version

     

    Date

     

    Creator

     

    Description

     

    1.0.0.1

     

    2003-11-15

     

    郑昀

     

    草稿

    Implementation Scope:

    本文档将说明出现一种不容易想到原因的访问数据库时发生“一般性网络错误”,错误报告的来源是ADODB,错误号是“-2147467259,或者0x80004005”。

     

    继续阅读之前,我们假设您熟悉以下知识:

    n         Microsoft SQL Server 2000

    n         Microsoft ADO

    关键词:

    SQL Server、ADO、DBMSSOCN、0x80004005

     

    现象

    一天,突然有这么一个问题摆在面前:

    用户浏览工作流系统时,突然跑出来这么一个错误:

     

    Microsoft VBScript 编译器错误 错误 '800a03f6'

     

    缺少 'End'

     

    /iisHelp/common/500-100.asp,行242

     

    Microsoft OLE DB Provider for SQL Server 错误 '80004005'

     

    [DBMSSOCN]一般性网络错误。请检查网络文档。

     

    /xxx/yyyframe.asp,行23

     

    经过排查,确定真正的原因在于调用ADO连接SQL Server 2000时,发生异常,错误描述就是“[DBMSSOCN]一般性网络错误。请检查网络文档。”,至于那个“Microsoft OLE DB Provider for SQL Server 错误 '80004005'”其实并没有太多意义。

     

    为什么会突然出现“[DBMSSOCN]一般性网络错误。”呢?

    服务器页面调用的是封装好的COM+ STA 组件,连接SQL Server 2000的其实是这个组件。

    后来又提供一个比较重要的信息,当这些事情发生的时候,注意到COM+应用的进程占用了200MB的内存。

    初步的猜想

    以前曾经在其他地方遇到过这种错误。

    但是,那是因为网卡或者网线闪断(“network is down”),造成连接数据库失败,服务又不停地试着去连接。不知道在什么情况下,服务不断报告:

     

    错误环境说明:运行SQL命令从数据库读取记录时发生COM异常;

    错误说明:[dbmssocn]一般性网络错误。请检查网络文档。

    错误号:-2147467259

    “[dbmssocn]”指的是,当前用TCP/IP协议与数据库通信。

     

    但是,这次环境的网络质量没有问题。

    模拟试验

    专家指出可能是因为同一台服务器和SQL Server之间的连接都没有Close,所以导致连接达到被允许的最大数目,从而被全部关闭。

    于是我们试验,看看一台服务器被允许与SQL Server建立最多多少个连接。

    更多信息

    测试程序中重用了原工程中InitADOCmd (_Command** ppiCmd)方法。

    这个方法利用ADO.Command::put_ActiveConnection方法来建立数据库连接的:

     

    varConn = _bstr_t("Provider=SQLOLEDB.1;……”);

    hr = t_piCmd->put_ActiveConnection(varConn);

     

    在Windows XP环境中,循环调用这个函数到了1980次,程序就出现几秒钟的停顿。之后,就得到0x80004005的错误返回值。这个值是由put_ActiveConnection方法返回的,并不是异常。所以看不到ADO异常描述。

    我们通过测试程序停滞时,立刻用一个VBS脚本再次请求建立数据库连接。于是,VBS脚本一起停滞,隔了几秒钟后,抛出异常,错误描述为:

     

    "[DBNETLIB][ConnectionOpen (PreLoginHandshake()).]一般性网络错误。请检查网络文档。"

     

    之后的1981、1982、...次put_ActiveConnectio调用,都会是同一个错误返回值。

     

    在SQL Server事件探查器中,看到1980次调用之前,都只有Audit Login事件。除非关闭测试程序,才会唰地一下所有的Audit Logout事件出来了。

     

    有时候,当第1981次建立连接的请求被SQL Server 2000认为超出允许范围时,SQL Server 2000会主动将这一千多个的连接同时全部中断。于是乎,在SQL Server事件探查器中,你也可以看到唰地一下所有的Audit Logout事件出来了。

     

    如果测试程序维持着这些数据库连接的话,内存会持续增长,如下所示:

     

     

    在WinXP上(Win2000上允许连接的数目少),

     

    情况1:

    单纯反复执行ADO.Command::put_ActiveConnection,则只有“Audit Login”事件,没有Logout事件。这种请求最多达到1980之后,就会出现“一般性网络错误”。

     

    情况2:

    如果是反复执行

    ADO.Command::put_ActiveConnection方法,然后又执行了查询,返回记录集,则这种循环最多达到483之后,就会出现“一般性网络错误”。

     

    在实际测试中,第1种情况,最开始Demo用了6MB内存,最后累积的内存是:104MB。

     第2种情况下,最开始Demo用了6MB内存,最后累积的内存是:39.5MB。

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    你可以通过下面的SQL语句察看当前与SQL Server保持的连接都来自于哪里,有多少个:

     

    SELECT dbid,DB_NAME(dbid) as DBName,hostname,status,last_batch

    FROM sysprocesses

    WHERE  DB_NAME(dbid)='%YourDatabaseName%' AND (last_batch > 'YY-MM-DD MM:SS:00')

    ORDER BY last_batch DESC

     

    总结:

    虽然这种情况出现的比较罕见,但是如果排除了网络质量原因,你也许可以注意一下当前服务器与SQL Server的connection数目是否维持在一个正在高涨的数量。

    当连接不断增加的时候,就要当心,服务器连接数据

    最新回复(0)