VC工程需要注意字符集问题

经过好多天,好多代码之后,才发现写VC程序时候,一定要注意字符集的问题,VS2012默认工程字符集为UNICODE,但是以前的VC工程不一定是UNICODE,VC6默认字符集为多字节字符集,如果我们在使用VC6代码时候,没有注意到这个问题,那么我们会遇到麻烦的。下面是转发的一篇文章,和我的遭遇基本上差不多:

VC真是一个非常笨,非常不友好的工具,还是这样说,VC(MFC)和现在流行的。net framework java比起来就想石器时代跟工业时代相比一样!
接触MFC也有几年了,为了它有过加班、有过熬夜、甚至通宵,代码没有十万行也应该有几万行了。但是MFC就是这么牛,它牛得不但令新手忘而却步,而且常常令有经验的软件工程师也栽跟斗。最近由于一个小小的环境设置设置问题花了很多时间,这跟用惯了VC6突然转到VC2005有关,但关键还是VC实在太笨了,它让我在一周内连续两中招次!

步骤/方法

  1.  
    第一次中招是这样的,很简单:
    我不知道VC.net2005默认工程默认设置是采用“Unicode字符集”(Unicode Character Set)的,以前用VC6工程的时候默认是“多字符集”(Multi-Byte Character Set)的。以前也没有用过VC.net2005啊,我一直认为。net是用来在framework上面编程的,在MFC上编程没有必要打开庞大的。net2005,把机器弄得像牛拉车一样。
    我声明了一个CString,按计划给它赋值,就像下面:
    CString s;
    s.Format(“count = %d”,count);
    按经验这肯定不会有错误的,但是不好意思,编译错误,因为这是我的环境采用的Unicode字符集的,而我给CString的Format函数是“多字符集”(Multi-Byte)所以编译不通过,要知道在这种设置下使用MessageBox(“ddd”);编译是不会通过的,因为系统调用的是MessageBoxW,即Unicode宽字符集的那个函数。
    还好我根据编译器的提示把s.Format(“count = %d”,count);改成s.Format(_T(“count = %d”,count);就搞定了,_T代表一个宏,宏的意思就是把字符串转成宽字符表示。同样的,MessageBox(“ddd”);可以为MessageBox(_T(“ddd”));
    但是还有个问题就是,所有窗体显示的东西都是宽字符的,例如a在内存里就是a\0两个字节,前面一个字节a后面是\0,当从窗体取下数据(例如用户输入)要跟其他平台交互时,例如网络传输到远端机器。如果那边使用的不是Unicode字符集,就会出问题,为了使界面和后台传输一致,只好使用把宽字符转换成多字符集表示:
    CString strWideChar; 
    strWideChar.Format(_T(“这是宽字节哦”)); 
    char buf[20]; 
    memset(buf,0,20); 
    WideCharToMultiByte( //转换Unicode到Ansi 
    CP_ACP, 
    WC_COMPOSITECHECK | WC_DEFAULTCHAR, 
    strWideChar, 
    strWideChar.GetLength(), 
    (char *)buf, //转换到缓冲区中 
    20, //最多个字节 
    0, 

    ); 
    同样的,你接收到的字符串想要在界面正常显示,还必须把它转换成宽字节表示:
    char chBytes[8]; 
    memcpy(chBytes,”aaaaaaa\0”,8); 
    WCHAR wch[9]; 
    n = MultiByteToWideChar( //转换Unicode到Ansi 
    CP_ACP, 
    0, 
    chBytes, 
    8, 
    wch, //转换到缓冲区中 
    8 //最多个字节 
    ); 
    wch[n] = '\0'; 
    这样每次从界面取数据和把数据显示到界面上都要先做处理,但是也可以把编译环境设置成“多字符集”(Multi-Byte Character Set),就可以避免这样转换来转换去(可惜我发现的时候代码已经差不多写完了)。就是在“Project->Configuration Properties->General->Character Set,选择”Use Unicode Character Set“就是使用Uncode字符集,选择” Use Multi-Byte Character Set“就是多字节字符集。
    VC++中应当注意对VC字符集的设置
  2.  
    第二次中招,god,花了我好长时间才找到问题:
    我在CodeProject上找了一个很厚道的老外写的一个继承了CDialog窗体类CResizableDialog的源码,这个类的作用是使MFC的窗体放大缩小时,窗体上的控件可以定位(Auchor),不要小看这个小小的每天都要用到的功能,用MFC实现真的很麻烦。很佩服那个老外写了那么多代码(当然跟他们的条件有关,资本主义国家的工人随便找个工作就可以衣食无忧,病了政府照顾,我们做“挨踢”的活得像民工一样,当然没有那个闲情去写那么好的代码免费给别人使用,这是题外话)。
    我拿了那个现成的工程,直接在我的工程里引用他的工程。Everything works perfect.直到我把项目发布成Release的,双击运行后没有任何反应,Very weird!后来我用MessageBox打印消息,发现运行到DoModal函数里面就没有出来,程序直接退出了!使用try,catch都得不到错误!因为我的窗体是继承老外写的窗体类来的,原先继承CDialog是好好的,问题肯定在他的工程里面,可是他给的示例程序没有任何问题啊。MFC出错的时候是很要命的,它不会给你任何提示,它就是不干了!
  3.  
    我又拿一个前的测试程序,让它从CResizableDialog继承,也没有任何问题。
    简直头大了、无语了,不知道哪里出现了问题,Release又不能像Debug那样调试,打了一堆MessageBox后还是不知道问题出现在哪里。凭着经验,可以知道程序中可能出现了内存的越界访问什么的致命错误,才会导致程序“一声不吭”地退出,但是究竟哪里出了问题呢?
    就在束手无策的时候,我发现调用CResizableDialog的成员函数EnableSaveRestore会引发链接错误:“未定义的外部符号”,不引用它不会出错,测试程序引用它没有任何错误。通常这个错误造成是因为引用函数在。h文件里声明了,但是在。cpp里面没有定义,或者。cpp文件里的定义和。h上的参数对不上。但是此时不可能是这个错误,因为测试程序没有错误啊。直觉告诉我这是解决“Release后程序直接退出的关键”,说不定这个函数调用的问题解决了Release的问题也解决了。
    MFC真是很强大,它强大得不但“像迷宫一样,里面有怪兽,进去一不小心就永远出不来”,而且它让你当遇到怪兽的时候总是给你一点点星光,只要你不放弃,奇迹就会出现,你就会练成绝世神功。这跟武侠小说是相通的,主人公每次到了生死关头就会出现奇迹,成为天下无敌的高手。看看我怎么找到解决方法的,Very tricky。
    VC++中应当注意对VC字符集的设置
  4.  
    既然调用EnableSaveRestore出现了不该出现的错误,那么就从这个函数开始找。这个函数是这样的:
    .h文件声明 
    void EnableSaveRestore(LPCTSTR pszSection, BOOL bRectOnly = FALSE); 
    .cpp文件定义 
    void CResizableDialog::EnableSaveRestore(LPCTSTR pszSection, BOOL bRectOnly/* = FALSE */) 

    m_sSection = pszSection; 
    m_bEnableSaveRestore = TRUE; 
    m_bRectOnly = bRectOnly; 
    // restore immediately 
    LoadWindowRect(pszSection, bRectOnly); 

  5.  
    上面的代码没有任何错误,既然没有错误,就要用使用以下方法来找:
    1.重新为CResizableDialog写一个函数,它没有参数的,调用它,发现没有错误,看来参数有问题。
    2.既然没有参数的函数没有错误,就把出问题的函数参数去掉吧,竟然也没有错误!那问题就肯定是出在参数上。
    3.去掉其中一个参数,测试发现是LPCTSTR pszSection的问题,而不是BOOL bRectOnly的问题。
    4.既然这样,那就换一种表示吧,把LPCTSTR pszSection换成WCHAR* pszSection,运行它,竟然不出错了!翻开MFC宏定义,就会发现其实LPCTSTR和WCHAR*是一样的,MFC真是freak!
    5.但是这个函数功能还是不正常,断点进入那个函数里面发现传进去的字符串只有一个字符了,这种情况就是宽字符当成短字符时,第二个字节的\0当成了字符串的截止字符了,也就是说,这个函数里采用的是短字符(多字符集Multi Byte)处理的。
    6.我的工程采用的是宽字符集(Unicode Char)的,检查设置,原来那个老外是用VC6编的,默认是使用多字符集(Multi Byte)的,VC真是笨啊,两个Project在一个Solution里面完全不同的设置竟然没有任何提示,简直把我弄死了!
    7.把引用工程也改成使用Unicode字符集,并且把函数EnableSaveRestore WCHAR* pszSection恢复原样,搞定!果然不出我所料,Release也没有问题了!我用以前的那个测试程序来使刚好以前把它设成Multi Byte,所以也没有错误,Damn!
    仅仅是一个设置啊,如果VC出错提示稍微好的,至少字符集不匹配不要说成“未定义的外部符号”也好用一点啊,难怪现在用VC的人越来越少了!
    注:通常说的VC不是指使用。net framework的VC,那个很简单,内存都不用管,通常是指非托管的VC。
    VC++中应当注意对VC字符集的设置

转发文章地址:

http://jingyan.baidu.com/article/6525d4b1090139ac7d2e9413.html

原文地址:https://www.cnblogs.com/sunylat/p/6119132.html