摆弄了一下午libxml2这个library, 现在就来说说.
1. 安装:
还是建议使用这里的binary, 应该比较稳定的, 不要追求最新版本而自己编译. self-build是一个很痛苦的过程, 效果也不一定就好. 尤其libxml2依赖libiconv, zlib这两个library. zlib还相对容易, 而libiconv在win32下的vs的support居然被drop掉了, 似乎只能用mingw编译了, 问题就是, mingw和vc2005的binary兼容性怎么样呢? 似乎有很多要注意的地方:
* Keep the interfaces pure C
* do explicit dynamic linking
* have your entry points and calling convention well behaved (ie. extern C, _cdecl, etc)
* don't do weird things in DllMain
* are careful about passing around pointers to heap memory managed by different runtimes
* look at padding and structure packing if you pass around pointers to structs (you don't seem to do that, though)
* are very careful about compatible code generation and register usage (stack frame pointers, EBP/ESP usage, register state preservation, etc)
2. 编译:
假设你已经在vs2005中设好了相应include, lib的路径, 于是你就可以编译了. libxml2提供了3个.lib文件, 你到底要用哪一个呢:
*) libxml2.lib: 显然用了这个就要依赖libxml2.dll啦.
*) libxml2_a.dll: a, archieve, 什么都不依赖. 可是必须要link到msvcrt.lib. 因为libxml2也是link到msvcrt.lib的. debug版本编译的时候会出现很诡异的问题. 就是同时连接到了debug和release版本的msvcrt(d).lib, 为什么呢? 自己想- -...解决方法就是加一个编译器选项: /nodefaultlib:msvcrt.lib. release版本不需要.
*) libxml2_a_dll.lib: 诶..这个是什么东西, a了还dll? 请看这里和这里. 意思就是说libxml2在win32下, 线程的使用在dll中有点小issue, 于是独立出一个lib, 其余的跟第二个lib一样.
好了, 都说完了, 我的额外的library是这么设的: ws2_32.lib zlib.lib iconv_a.lib libxml2_a.lib
3. 编码:
诶.. 好像顺序反了.
其实coding并没有什么好说的, 看文档吧, 即使那个文档写的让人看了及其的难受强烈建议用doxygen自己生成一个慢慢看还能来回点啊哈哈哈好长一句话.
有一点比较重要的就是libxml2内部处理使用的都是utf-8编码, 也就是说input, output虽然都是xmlChar*(其实就是unsigned char*), 但其实是utf-8编码的unsigned char*. 还记得字符集编码的概念么? 不记得点这里- -... 如果传入的参数不是utf-8编码, 可是会报错的哟, 而且编译好的binary无法disable error输出.....
还有一点就是: libxml2不支持gbk编码! 什么? 对你没看错. 那怎么办? n种方法:
*) 直接掉libiconv的函数转... 好像很赖皮.
*) 改libxml2源码, 自己加上去, 好像有人这么做的, 点这里. 有点麻烦额.
*) 有一个xmlNewCharEncodingHandler()的函数, 疑似可以加gbk以及其它编码支持, 可以看看@@...
然后coding吧, 一个简单的console程序有点小大, 1.1M左右, 呵呵, 只需要msvcrt(??).dll的link.
还有就是这篇文章值得一看: http://www.blogjava.net/wxb_nudt/archive/2007/11/18/161340.html



