本文实例讲述了Python3.4编程实现简单抓取爬虫功能。分享给大家供大家参考,具体如下:
import urllib.request
import urllib.parse
import re
import urllib.request,urllib.parse,http.cookiejar
import time
def getHtml(url):
cj=http.cookiejar.CookieJar()
opener=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36'),('Cookie','4564564564564564565646540')]
urllib.request.install_opener(opener)
page = urllib.request.urlopen(url)
html = page.read()
return html
#print ( html)
#html = getHtml("http://weibo.com/")
def getimg(html):
html = html.decode('utf-8')
reg='"screen_name":"(.*?)"'
imgre = re.compile(reg)
src=re.findall(imgre,html)
return src
#print ("",getimg(html))
uid=['2808675432','3888405676','2628551531','2808587400']
for a in list(uid):
print (getimg(getHtml("http://weibo.com/"+a)))
time.sleep(1)
更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》
希望本文所述对大家Python程序设计有所帮助。
# Python3.4
# 抓取
# 爬虫
# Python爬虫实例爬取网站搞笑段子
# Python网络爬虫与信息提取(实例讲解)
# python利用urllib实现爬取京东网站商品图片的爬虫实例
# python制作小说爬虫实录
# python爬虫实战之最简单的网页爬虫教程
# Python 爬虫之超链接 url中含有中文出错及解决办法
# Python实现的爬虫功能代码
# 基于python爬虫数据处理(详解)
# python爬虫入门教程--HTML文本的解析库BeautifulSoup(四)
# Python爬虫之模拟知乎登录的方法教程
# python爬虫入门教程--优雅的HTTP库requests(二)
# Python爬虫实现(伪)球迷速成
# 进阶
# 操作技巧
# 相关内容
# 数据结构
# 给大家
# 更多关于
# 所述
# 程序设计
# 使用技巧
# 编程技巧
# 讲述了
# addheaders
# HTTPCookieProcessor
# Agent
# User
# CookieJar
# cj
# build_opener
# opener
# AppleWebKit
相关文章:
c++怎么使用类型萃取type_traits_c++ 模板元编程类型判断【方法】
网站制作的软件有哪些,制作微信公众号除了秀米还有哪些比较好用的平台?
微网站制作教程,我微信里的网站怎么才能复制到浏览器里?
宝塔面板如何快速创建新站点?
网站视频制作书签怎么做,ie浏览器怎么将网站固定在书签工具栏?
实现点击下箭头变上箭头来回切换的两种方法【推荐】
广州网站设计制作一条龙,广州巨网网络科技有限公司是干什么的?
Swift中switch语句区间和元组模式匹配
唐山网站制作公司有哪些,唐山找工作哪个网站最靠谱?
PHP正则匹配日期和时间(时间戳转换)的实例代码
电影网站制作价格表,那些提供免费电影的网站,他们是怎么盈利的?
C++如何将C风格字符串(char*)转换为std::string?(代码示例)
名字制作网站免费,所有小说网站的名字?
制作表格网站有哪些,线上表格怎么弄?
深圳网站制作公司好吗,在深圳找工作哪个网站最好啊?
高端企业智能建站程序:SEO优化与响应式模板定制开发
学校免费自助建站系统:智能生成+拖拽设计+多端适配
西安专业网站制作公司有哪些,陕西省建行官方网站?
网站制作的步骤包括,正确网址格式怎么写?
怎么将XML数据可视化 D3.js加载XML
无锡营销型网站制作公司,无锡网选车牌流程?
建站DNS解析失败?如何正确配置域名服务器?
广州建站公司哪家好?十大优质服务商推荐
全景视频制作网站有哪些,全景图怎么做成网页?
宿州网站制作公司兴策,安徽省低保查询网站?
完全自定义免费建站平台:主题模板在线生成一站式服务
公司网站制作费用多少,为公司建立一个网站需要哪些费用?
电商网站制作公司有哪些,1688网是什么意思?
魔方云NAT建站如何实现端口转发?
网站制作公司排行榜,四大门户网站排名?
如何在Golang中引入测试模块_Golang测试包导入与使用实践
制作ppt免费网站有哪些,有哪些比较好的ppt模板下载网站?
高防服务器租用如何选择配置与防御等级?
如何基于PHP生成高效IDC网络公司建站源码?
建站之星代理平台如何选择最佳方案?
网页制作模板网站推荐,网页设计海报之类的素材哪里好?
香港网站服务器数量如何影响SEO优化效果?
建站之星安装路径如何正确选择及配置?
如何使用Golang安装API文档生成工具_快速生成接口文档
网站网页制作专业公司,怎样制作自己的网页?
孙琪峥织梦建站教程如何优化数据库安全?
香港代理服务器配置指南:高匿IP选择、跨境加速与SEO优化技巧
如何快速使用云服务器搭建个人网站?
在线制作视频网站免费,都有哪些好的动漫网站?
如何用美橙互联一键搭建多站合一网站?
活动邀请函制作网站有哪些,活动邀请函文案?
如何快速打造个性化非模板自助建站?
如何快速上传自定义模板至建站之星?
定制建站流程步骤详解:一站式方案设计与开发指南
如何选购建站域名与空间?自助平台全解析
*请认真填写需求信息,我们会在24小时内与您取得联系。