» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

求个批量HTML提取指定class内容的方法

posted by wap, platform: iPhone

免费软件还是脚本,什么都行...


TOP

posted by wap, platform: iPhone

提取的内容是  <td class="post-body>  </td> 里面的内容



TOP

posted by wap, platform: iPhone
引用:
原帖由 @黑暗骑士巫妖王  于 2013-4-28 15:53 发表
posted by wap, platform: Nexus 7

python+BeautifulSoup干这个是神器,只要几行代码就搞定了。下面附上以前用抓新浪微博的:

# * coding:UTF8 *

import urllib2
from BeautifulSoup import BeautifulSoup
...
能弄成批量导入本地html的么?


TOP

发新话题
     
官方公众号及微博