写一个测试用的html文件:html-clean-demo.html新剑侠传奇win32位无法进入大型场景修复补丁1.0 绿色免费版
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd " >
< html xmlns = "http://www.w3.org/1999/xhtml " xml:lang = "zh-CN" dir = "ltr" >
< head >
< meta http-equiv = "Content-Type" content = "text/html; charset=GBK" />
< meta http-equiv = "Content-Language" content = "zh-CN" />
< title > html clean demo </ title >
</ head >
< body >
< div class = "d_1" >
< ul >
< li > bar </ li >
< li > foo </ li >
< li > gzz </ li >
</ ul >
</ div >
< div >
< ul >
< li > < a name = "my_href" href = "1.html" > text-1 </ a > </ li >
< li > < a name = "my_href" href = "2.html" > text-2 </ a > </ li >
< li > < a name = "my_href" href = "3.html" > text-3 </ a > </ li >
< li > < a name = "my_href" href = "4.html" > text-4 </ a > </ li >
</ ul >
</ div >
</ body >
</ html >
Html代码
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="zh-CN" dir="ltr">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=GBK"/>
<meta http-equiv="Content-Language" content="zh-CN"/>
<title>html clean demo</title>
</head>
<body>
<div class="d_1">
<ul>
<li>bar</li>
<li>foo</li>
<li>gzz</li>
</ul>
</div>
<div>
<ul>
<li><a name="my_href" href="1.html">text-1</a></li>
<li><a name="my_href" href="2.html">text-2</a></li>
<li><a name="my_href" href="3.html">text-3</a></li>
<li><a name="my_href" href="4.html">text-4</a></li>
</ul>
</div>
</body>
</html>
模拟需求:取出title,name="my_href"的链接,div的class="d_1"下的所有li内容。下面用htmlcleaner写代码,HtmlCleanerDemo.java
package com.chenlb;
import java.io.File;
import org.htmlcleaner.HtmlCleaner;
import org.htmlcleaner.TagNode;
/**
* htmlcleaner 使用示例.
*
* @author chenlb 2008-11-26 下午02:12:02
*/
public class HtmlCleanerDemo {
public static void main(String[] args) throws Exception {
HtmlCleaner cleaner = new HtmlCleaner();
TagNode node = cleaner.clean(new File( "html/html-clean-demo.html" ), "GBK" );
//按tag取.
Object[] ns = node.getElementsByName("title" , true ); //标题
if (ns.length > 0 ) {
System.out.println("title=" +((TagNode)ns[ 0 ]).getText());
}
System.out.println("ul/li:" );
//按xpath取
ns = node.evaluateXPath("//div[@class='d_1']//li" );
for (Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" text=" +n.getText());
}
System.out.println("a:" );
//按属性值取
ns = node.getElementsByAttValue("name" , "my_href" , true , true );
for (Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" href=" +n.getAttributeByName( "href" )+ ", text=" +n.getText());
}
}
}
Java代码
package com.chenlb;
import java.io.File;
import org.htmlcleaner.HtmlCleaner;
import org.htmlcleaner.TagNode;
/**
* htmlcleaner 使用示例.
*
* @author chenlb 2008-11-26 下午02:12:02
*/
public class HtmlCleanerDemo {
public static void main(String[] args) throws Exception {
HtmlCleaner cleaner = new HtmlCleaner();
TagNode node = cleaner.clean(new File("html/html-clean-demo.html"), "GBK");
//按tag取.
Object[] ns = node.getElementsByName("title", true); //标题
if(ns.length > 0) {
System.out.println("title="+((TagNode)ns[0]).getText());
}
System.out.println("ul/li:");
//按xpath取
ns = node.evaluateXPath("//div[@class='d_1']//li");
for(Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" text="+n.getText());
}
System.out.println("a:");
//按属性值取
ns = node.getElementsByAttValue("name", "my_href", true, true);
for(Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" href="+n.getAttributeByName("href")+", text="+n.getText());
}
}
}
cleaner.clean()中的参数,可以是文件,可以是url,可以是字符串内容。个人认为:比较常用的应该是evaluateXPath、getElementsByAttValue、getElementsByName方法了。另外说明下,htmlcleaner对不规范的html兼容性比较好。
它被设计的小,快速,灵活而且独立。HtmlCleaner也可用在Java代码中,当命令行工具或Ant任务。解析后编程轻量级文档对象,能够很容易的被转换到DOM或者JDom标准文档,或者通过各种方式(压缩,打印)连续输出XML。
1.HtmlCleaner的文档对象模型拥有了一些函数,处理节点和属性,所以在序列化之前搜索或者编辑是非常容易的。
2.提供基本HtmlCleanerDOM的XPath支持
3.使用XML配置文件让创建定制tag变得更加容易
4.修复多个bug以及API改进
HtmlCleaner是一个免费开源的适用范围广的Java语言Html文档解析器,它能重新整理HTML文档的每个元素并生成结构良好(Well-Formed)的HTML文档。默认它遵循的规则是类似于大部份web浏览器为创文档对象模型所使用的规则,户可以提供自定义tag和规则组来进行过滤和匹配。
乐鱼游戏 体育买球知乎 亚博休育 ror体育提现 蓝茵体育机构展开内容
神枪手强尼无限钞票宝石版下载-神枪手强尼无限钞票宝石版1.12.32 最新版
农招网(农业求职招聘)软件下载-农招网APP1.0.2安卓版
宁海旅游软件下载-宁海智慧旅游app1.3.1 安卓手机版
即刻点击Tap on Time下载-Tap on Time(即刻点击小游戏)0.34 手机版
模拟驾考软件-壁虎驾考20141.05官方安装版
合成星球游戏下载-合成星球小游戏1.09 官方版
悦度荣县app-悦度荣县软件1.0.0 最新版
运销宝司机官方版免费下载-运销宝司机1.8.8 安卓版
一键还原备份SGI怎么用-一键还原备份SGI2.0.0.3 官方免费版【SGI映像总裁】
电脑无线路由器软件-win7虚拟无线路由器1.1 中文绿色免费版
秒闪去水印软件下载-秒闪去水印app1.1.1 安卓版
ria2c度盘下载器v5.5.1.6免费版
纯净待办app1.0 安卓免费版
拉钉师傅app1.0.10 师傅端
地球眼软件下载-地球眼卫星1.0.4安卓版
7.8/1,339.7M
爱上包头手机版专为内蒙古包头地区打造的本土最新资讯热点阅读软件,能够让当地居民更为方便的了解日常当地的最新政治动态,在家也可关心祖国,非常的方便又好用,还有当地...
8.0/1,808.7M
新梦幻古龙是一款武侠战斗冒险rpg手游。游戏有着丰富的剧情内容,根据古龙武侠小说打造。熟悉的武侠角色再现,丰富的游戏内容。多种游戏模式,学习强大的武功,创造有血...
7.8/1,987.4M
由腾讯打造的一款学习软件,乐学小鹅提供小学、初中、高中的课程内容,每个学科几乎都有,配套课本知识内容,让学习变得简单高效。乐学小鹅app介绍乐学小鹅是腾讯自营的...
9.9/847.8M
2-6岁家庭英语启蒙在线课堂,小小英语L1app内容很丰富,小卡片学习,随时训练,轻松掌握英语单词,家中有小孩子的不要错过了。小小英语L1介绍小小英语是指单词,...
10.0/1,269.5M
三消类型的手游是目前最简单以及最受到所有的玩家喜欢的,游戏难度简单以及关卡都是多的,随时的都是可以玩的,现在就可以来免费的下载!三消大作战游戏介绍一款超好玩的三...
7.7/1,746.8M
出击飞龙HD这款游戏是根据早期80年代的小游戏出击飞龙的重制版本,游戏太过经典粉丝众多一般开发商都会选择将老游戏重制,为的就是满足自己的粉丝,只有获得良好的口碑...
9.8/341.2M
斗鱼TV评论小助手(弹幕助手)是专门为斗鱼TV直播设计的小工具,可以帮你在全屏直播时查看到观众弹幕评论。本工具的主要目的是为了使主播在直播的途中,能实时的观察到...
MagicPhoto安卓版下载-MagicPhoto app1.0.8 安卓中文版
9.8/1,209.3M
MagicPhotoapp是一款支持中文的魔法相册软件,支持图片美化,相册拼图,魔法功能和贴纸和动图的制作,软件功能强大,简单易于使用。简单易用的魔法相机软件M...
8.3/698.6M
知城优聘app是一款拥有丰富本地招聘信息的服务软件,旨在帮助求职者更方便地寻找心仪的工作。这款软件通过简单易用的界面和多元化的功能,让求职者能够轻松地搜索和筛选...
8.6/850.1M
这是一款十分有趣的投篮类型游戏,会有投篮辅助线帮助你进行投篮,玩家需要做的就是在规定的时间内,把球给投进去,可玩性十分高!游戏介绍史诗篮球游戏是一款物理类玩法休...
9.6/340.5M
oa办公系统是一款具备了常见的IM功能,还具有日程和文档管理功能的企业级办公管理系统。非常的实用。有需要的可以来东坡下载使用!oa办公系统说明明道Chat是一款...
High School Love Crush-Fashion Games(高中爱情粉碎游戏)1.1.2 安卓版
7.7/1,417.0M
是一款以高中恋爱为题材类的游戏,在这里你将重新感受到当年高中时候的各种浪漫爱情故事,你也要花时间打扮好自己去约会等,是一款真实的还原了恋爱类游戏。游戏简介你曾经...
2015年圣诞节歌曲有哪些-2015年圣诞节酒吧常用歌曲大全1.0.1 免费最新版
7.8/1,260.4M
很多人都想要在圣诞节取酒吧玩耍,其实完全没有必要,因为有2015年圣诞节酒吧常用歌曲大全,就能让你在家里面拥有酒吧圣诞节歌曲。帮助你度过一个完美的圣诞节!201...
Helix Jump ball下载-Helix Jump手游2.0.3 安卓版
9.6/353.8M
HelixJump是一款休闲清新小游戏,玩家按住屏幕可以控制小球进行俯冲和加速,放开屏幕就能体验飞一样的感觉,游戏目的是获得最高分即可,注意避开其它颜色。Hel...
8.0/564.4M
很方便的一款配送平台,送件侠app可以无缝衔接订单平台,会有很多的骑手抢单,多种下单方式满足不同用户的需求。送件侠是干什么的送件侠是一款集自动接单、自动打印、自...
9.5/129.6M
这是专为店铺打造的运营管理软件,懒店长app能为广大用户提供便捷的功能,提高工作效率,盘客户管理、统计个人业绩,让店铺运行更加一体化。软件介绍懒店长是专门针对零...
9.4/1,213.6M
枪神大决战游戏是一款枪战射击模拟挑战类的游戏,玩起来比较简单,游戏中也有很多感受刺激的射击体验。包括单人模式和多人模式,玩家可以闯过各种关卡。枪神大决战游戏介绍...
猎魔无双首续0.1爆充版下载-猎魔无双永久0.1折至臻打金版1.0.3 送满v
8.8/967.4M
猎魔无双永久0.1折至臻打金版上线就送切割特戒、GM扶持、满级VIP等等福利满满!这是一款以3D魔幻为主题的MMO手游,游戏风格独特且千变万化。在游戏中,玩家将...
8.3/1,909.8M
部落大作战满V版是款3D卡通风格的画面,让游戏更具休闲趣味,萌萌哒的可爱角色让你爱不释手,在这里可以展现自己的完美实力,游戏拥有别具一格的游戏风格,超刺激的冒险...
8.4/122.3M
迷你dayz手游电脑版是最近超级火的一款像素冒险生存手游,可以说非常好玩了,很多玩家都在玩,给大家提供是最新的电脑版本,操作起来更顺畅,感兴趣的快来下载吧!迷你...
Ty2y rar密码破解软件下载-Ty2y密码破解工具1.0免费版
7.9/1,267.7M
Ty2y密码破解工具是一款简单好用的密码破解工具,用户通过这款软件能直接破解RAR压缩文件密码,支持支持zip、7-zip、好压等格式,非常方便,节省时间,需要...
8.2/1,419.7M
在lols7总决赛8进4的比赛中,we成功击败c9,进入了4强。在第5场比赛中,we使用了为所欲为阵容,这里带来了s7总决赛WE为所欲为表情包,来看看we是怎么...
九九坐标转换软件下载-九九坐标转换免安装版8.36官方最新版
9.0/448.7M
九九坐标转换免安装版是一款作弊转换定位软件,可以计算全国各地范围坐标,表达计算公式,是测量人员、地质人员、科考人员、工程技术人员必备的辅助工具,需要的朋友快来下...
9.3/1,379.5M
本软件是一款比较试用的程控交换机计费系统,它内置120多种国产、进口交换机话单格式,符合长途按秒计费、本地分段计费新规则,兼容多家电信公司不同的费率及折价率,网...
样式和壁纸(wallpapers)-样式和壁纸美化app1.3.169416333安去广告版
9.6/251.2M
样式和壁纸app是一款非场好用的手机壁纸软件,这款软件操作简单,功能丰富全面。这里汇集了海量精选优质的高清图片壁纸,并且风格种类丰富,款式多样,还能够一键免费下...