jsoup-1.10.2.jar是很有用的jar包,可以使用Jsoup 抓取頁面的數(shù)據(jù),從官網(wǎng)下載的。程序員朋友們不要錯(cuò)過了,html解析最好的開源包,功能強(qiáng)大,提供了一套非常省力的API。有需要的朋友們不要錯(cuò)過。可以直接解析某個(gè)URL地址、HTML文本內(nèi)容。jsoup還可以通過DOM、CSS以及類似于jQuery的操作方法來取出和操作數(shù)據(jù)。如果你需要使用Java解析html文檔,那么jsoup將是你不二的選擇!
內(nèi)容
jsoup-1.10.2-sources.jar
jsoup-1.10.2-javadoc.jar
jsoup-1.10.2.jar
jsoup簡(jiǎn)介
Java 程序在解析HTML 文檔時(shí),從HTML中攫取你所需的信息 和擴(kuò)展HTMLParser 對(duì)自定義標(biāo)簽的處理能力。但現(xiàn)在我已經(jīng)不再使用htmlparser 了,原因是htmlparser 很少更新,但最重要的是有了jsoup 。
jsoup 是一款Java 的HTML解析器,可直接解析某個(gè)URL地址、HTML文本內(nèi)容。它提供了一套非常省力的API,可通過DOM,CSS以及類似于jQuery的操作方法來取出和操作數(shù)據(jù)。
主要功能
1.從URL、文件或字符串中提取并解析HTML
2.查找和提取數(shù)據(jù),使用DOM遍歷或CSS選擇器
3.操縱HTML元素、屬性和文本
4.根據(jù)安全的白名單清理用戶提交的內(nèi)容,以防止XSS攻擊
5.輸出整潔的HTML
jsoup是基于MIT協(xié)議發(fā)布的,可放心使用于商業(yè)項(xiàng)目