A5下载站:努力做内容最丰富最安全的下载站! 网站地图最新更新下载排行专题软件发布

热门软件

地铁跑酷

冒险迷岛

全民迷宫

连连消大作战

小河狸创客

阿里健康医鹿

支付宝app

番薯小说

MOMO陌陌

虾米音乐app

位置导航:A5下载 > 源码技巧 > 父类数据

Python使用bs4获取58同城城市分类的方法

时间:2015-07-08 17:29来源:a5源码作者:zhao浏览:133
这篇文章主要介绍了Python使用bs4获取58同城城市分类的方法,涉及Python使用BeautifulSoup库解析html页面的技巧,需要的朋友可以参考下
……

本文实例讲述了Python使用bs4获取58同城城市分类的方法。分享给大家供大家参考。具体如下:

# -*- coding:utf-8 -*-

#! /usr/bin/python

import urllib

import os, datetime, sys

from bs4 import BeautifulSoup

reload(sys)

sys.setdefaultencoding( "utf-8" )

__BASEURL__ = "http://bj.58.com/"

__INITURL__ = "http://bj.58.com/hezu/"

soup=BeautifulSoup(urllib.urlopen(__INITURL__))

lv1Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem')('a',href=True)

f=open('data.txt', 'w')

for element in lv1Elements[1:]:

f.write((element.get_text() + 'rn'))

print element.get_text()

url = __BASEURL__ + element.get('href')

print url

soup=BeautifulSoup(urllib.urlopen(url))

lv2Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem').find('div', 'subarea').find_all('a')

texts = [t.get_text() for t in lv2Elements]

f.write(' '.join(texts) + 'rnrn')

f.close()

希望本文所述对大家的Python程序设计有所帮助。