很有用的jar包,從官網(wǎng)下載的。
內(nèi)容:
org.jsoup.Jsoup;org.jsoup.nodes.Document;
org.jsoup.nodes.Element;
org.jsoup.select.Elements;
jsoup 簡(jiǎn)介
Java 程序在解析HTML 文檔時(shí),相信大家都接觸過(guò)htmlparser 這個(gè)開(kāi)源項(xiàng)目,我曾經(jīng)在IBM DW 上發(fā)表過(guò)兩篇關(guān)于htmlparser 的文章,分別是:從HTML中攫取你所需的信息 和擴(kuò)展HTMLParser 對(duì)自定義標(biāo)簽的處理能力。但現(xiàn)在我已經(jīng)不再使用htmlparser 了,原因是htmlparser 很少更新,但最重要的是有了jsoup 。jsoup 是一款Java 的HTML解析器,可直接解析某個(gè)URL地址、HTML文本內(nèi)容。它提供了一套非常省力的API,可通過(guò)DOM,CSS以及類似于jQuery的操作方法來(lái)取出和操作數(shù)據(jù)。
jsoup的主要功能如下:
1. 從一個(gè)URL,文件或字符串中解析HTML;2. 使用DOM或CSS選擇器來(lái)查找、取出數(shù)據(jù);
3. 可操作HTML元素、屬性、文本;
jsoup是基于MIT協(xié)議發(fā)布的,可放心使用于商業(yè)項(xiàng)目