C++のHTMLパーサ

Linux(GCC)でC++のやつとなると結構少ない。
Windows(C#)とかPerlとかJavaとかならいろいろあるが。

そんな中で比較的軽量で使えそうなのがこれ。

htmlcxx
http://htmlcxx.sourceforge.net/

その前に日本語を扱う場合はlibiconvを入れておく。

http://www.gnu.org/software/libiconv/

導入は下記のサイトあたりが参考に。
http://install.pocari.org/libiconv-1.10.html

(MinGWの場合)

htmlcxxのインストールは大体定番の手順。(configure、make、make install)

$ cd ~
$ mkdir src
$ cd src
$ wget http://sourceforge.net/projects/htmlcxx/files/htmlcxx/0.84/htmlcxx-0.84.tar.gz
$ tar zxvf htmlcxx-0.84.tar.gz
$ cd htmlcxx-0.84
$ ./configure –prefix=/usr/local
$ make
$ su
# make install

/usr/local/lib に htmlcxx.so ができるので、ここにライブラリパスを通す。

# cd /etc/ld.so.conf.d/
# vi htmlcxx.conf

このファイルに

/usr/local/lib

と書いて保存。

# /sbin/ldconfig
(/sbin にパスが通っていれば ldconfig のみで)

で反映。

Eclipseで参照する場合は、こちらあたりが参考に。
Eclipseで自動Makeするときのincludeや外部ライブラリの設定

タイトルとURLをコピーしました