» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

求个批量HTML提取指定class内容的方法

引用:
原帖由 黑暗骑士巫妖王 于 2013-4-28 17:26 发表
posted by wap, platform: Nexus 7

正则表达式早就过时了,你有写正则表达式的时间,各种HTML、XML解析库早就搞定啦,处理这类玩意还是专业的库更可靠
+1
java可以用jsoup,挺简单的。
Connection c = Jsoup.connect(“xxxx”);
Document doc = c.get();
Elements ele = doc.select("td[class=post-body]");
for (Element element : ele) {
      String txt= element.text();
}
其它语言肯定也有类似的库。


TOP

发新话题
     
官方公众号及微博