banner
大数据平台>大数据技术与应用>Python抓取PM2.5浓度和排名

Python实现抓取城市的PM2.5浓度和排名

作者: afenxi来源: afenxi时间:2017-03-12 18:30:54

主机环境:(Python2.7.9 / Win8_64 / bs4)

利用BeautifulSoup4来抓取 www.pm25.com 上的PM2.5数据,之所以抓取这个网站,是因为上面有城市PM2.5浓度排名(其实真正的原因是,它是百度搜PM2.5出来的第一个网站!)

程序里只对比了两个城市,所以多线程的速度提升并不是很明显,大家可以弄10个城市并开10个线程试试。

最后吐槽一下:上海的空气质量怎么这么差!!!

PM25.py

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# by ustcwq

import urllib2

import threading

from time import ctime

from bs4 import BeautifulSoup

def getPM25(cityname):

site = http://www.pm25.com/ + cityname + .html

html = urllib2.urlopen(site)

soup = BeautifulSoup(html)

city = soup.find(class_ = bi_loaction_city)   # 城市名称

aqi = soup.find("a",)  # AQI指数

quality = soup.select(".bi_aqiarea_right span")  # 空气质量等级

result = soup.find("div",class_ =bi_aqiarea_bottom)   # 空气质量描述

print city.text + uAQI指数: + aqi.text + u 空气质量: + quality[0].text + result.text

print **20 + ctime() + **20

def one_thread():   # 单线程

print One_thread Start:  + ctime() + 

getPM25(hefei)

getPM25(shanghai)

def two_thread():   # 多线程

print Two_thread Start:  + ctime() + 

threads = []

t1 = threading.Thread(target=getPM25,args=(hefei,))

threads.append(t1)

t2 = threading.Thread(target=getPM25,args=(shanghai,))

threads.append(t2)

for t in threads:

# t.setDaemon(True)

t.start()

if __name__ == __main__:

one_thread()

print   * 2

two_thread()

Python实现抓取城市的PM2.5浓度和排名-数据分析网 Python实现抓取城市的PM2.5浓度和排名-数据分析网

原创文章,作者:数据特工,如若转载,请注明出处:《Python实现抓取城市的PM2.5浓度和排名》http://www.afenxi.com/post/5649

banner
看过还想看
可能还想看
最新文章
Yonghong Z-Suite一站式大数据分析平台 —— 以卓越的数据技术为客户创造价值,实现客户成功。