原帖由 @黑暗骑士巫妖王 于 2013-4-28 15:53 发表
posted by wap, platform: Nexus 7
python+BeautifulSoup干这个是神器,只要几行代码就搞定了。下面附上以前用抓新浪微博的:
# * coding:UTF8 *
import urllib2
from BeautifulSoup import BeautifulSoup
...
原帖由 黑暗骑士巫妖王 于 2013-4-28 17:26 发表
posted by wap, platform: Nexus 7
正则表达式早就过时了,你有写正则表达式的时间,各种HTML、XML解析库早就搞定啦,处理这类玩意还是专业的库更可靠
欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/) | Powered by Discuz! 6.0.0 |