全网整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:400-708-3566

Python3.4编程实现简单抓取爬虫功能示例

本文实例讲述了Python3.4编程实现简单抓取爬虫功能。分享给大家供大家参考,具体如下:

import urllib.request
import urllib.parse
import re
import urllib.request,urllib.parse,http.cookiejar
import time
def getHtml(url):
  cj=http.cookiejar.CookieJar()
  opener=urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
  opener.addheaders=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36'),('Cookie','4564564564564564565646540')]
  urllib.request.install_opener(opener)
  page = urllib.request.urlopen(url)
  html = page.read()
  return html
#print ( html)
#html = getHtml("http://weibo.com/")
def getimg(html):
  html = html.decode('utf-8')
  reg='"screen_name":"(.*?)"'
  imgre = re.compile(reg)
  src=re.findall(imgre,html)
  return src
#print ("",getimg(html))
uid=['2808675432','3888405676','2628551531','2808587400']
for a in list(uid):
  print (getimg(getHtml("http://weibo.com/"+a)))
  time.sleep(1)

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。


# Python3.4  # 抓取  # 爬虫  # Python爬虫实例爬取网站搞笑段子  # Python网络爬虫与信息提取(实例讲解)  # python利用urllib实现爬取京东网站商品图片的爬虫实例  # python制作小说爬虫实录  # python爬虫实战之最简单的网页爬虫教程  # Python 爬虫之超链接 url中含有中文出错及解决办法  # Python实现的爬虫功能代码  # 基于python爬虫数据处理(详解)  # python爬虫入门教程--HTML文本的解析库BeautifulSoup(四)  # Python爬虫之模拟知乎登录的方法教程  # python爬虫入门教程--优雅的HTTP库requests(二)  # Python爬虫实现(伪)球迷速成  # 进阶  # 操作技巧  # 相关内容  # 数据结构  # 给大家  # 更多关于  # 所述  # 程序设计  # 使用技巧  # 编程技巧  # 讲述了  # addheaders  # HTTPCookieProcessor  # Agent  # User  # CookieJar  # cj  # build_opener  # opener  # AppleWebKit 


相关文章: c++怎么使用类型萃取type_traits_c++ 模板元编程类型判断【方法】  网站制作的软件有哪些,制作微信公众号除了秀米还有哪些比较好用的平台?  微网站制作教程,我微信里的网站怎么才能复制到浏览器里?  宝塔面板如何快速创建新站点?  网站视频制作书签怎么做,ie浏览器怎么将网站固定在书签工具栏?  实现点击下箭头变上箭头来回切换的两种方法【推荐】  广州网站设计制作一条龙,广州巨网网络科技有限公司是干什么的?  Swift中switch语句区间和元组模式匹配  唐山网站制作公司有哪些,唐山找工作哪个网站最靠谱?  PHP正则匹配日期和时间(时间戳转换)的实例代码  电影网站制作价格表,那些提供免费电影的网站,他们是怎么盈利的?  C++如何将C风格字符串(char*)转换为std::string?(代码示例)  名字制作网站免费,所有小说网站的名字?  制作表格网站有哪些,线上表格怎么弄?  深圳网站制作公司好吗,在深圳找工作哪个网站最好啊?  高端企业智能建站程序:SEO优化与响应式模板定制开发  学校免费自助建站系统:智能生成+拖拽设计+多端适配  西安专业网站制作公司有哪些,陕西省建行官方网站?  网站制作的步骤包括,正确网址格式怎么写?  怎么将XML数据可视化 D3.js加载XML  无锡营销型网站制作公司,无锡网选车牌流程?  建站DNS解析失败?如何正确配置域名服务器?  广州建站公司哪家好?十大优质服务商推荐  全景视频制作网站有哪些,全景图怎么做成网页?  宿州网站制作公司兴策,安徽省低保查询网站?  完全自定义免费建站平台:主题模板在线生成一站式服务  公司网站制作费用多少,为公司建立一个网站需要哪些费用?  电商网站制作公司有哪些,1688网是什么意思?  魔方云NAT建站如何实现端口转发?  网站制作公司排行榜,四大门户网站排名?  如何在Golang中引入测试模块_Golang测试包导入与使用实践  制作ppt免费网站有哪些,有哪些比较好的ppt模板下载网站?  高防服务器租用如何选择配置与防御等级?  如何基于PHP生成高效IDC网络公司建站源码?  建站之星代理平台如何选择最佳方案?  网页制作模板网站推荐,网页设计海报之类的素材哪里好?  香港网站服务器数量如何影响SEO优化效果?  建站之星安装路径如何正确选择及配置?  如何使用Golang安装API文档生成工具_快速生成接口文档  网站网页制作专业公司,怎样制作自己的网页?  孙琪峥织梦建站教程如何优化数据库安全?  香港代理服务器配置指南:高匿IP选择、跨境加速与SEO优化技巧  如何快速使用云服务器搭建个人网站?  在线制作视频网站免费,都有哪些好的动漫网站?  如何用美橙互联一键搭建多站合一网站?  活动邀请函制作网站有哪些,活动邀请函文案?  如何快速打造个性化非模板自助建站?  如何快速上传自定义模板至建站之星?  定制建站流程步骤详解:一站式方案设计与开发指南  如何选购建站域名与空间?自助平台全解析 

您的项目需求

*请认真填写需求信息,我们会在24小时内与您取得联系。