Java读取网页内容并下载图片的实例

很多人在第一次了解数据采集的时候,可能无从下手,尤其是作为一个新手,更是感觉很是茫然,所以,在这里分享一下自己的心得,希望和大家一起分享技术,如果有什么不足,还请大家指正。写出这篇目的,就是希望大家一起成长,我也相信技术之间没有高低,只有互补,只有分享,才能使彼此更加成长。
示例代码:
import java.io.BufferedInputStream;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class GetContentPicture {
public void getHtmlPicture(String httpUrl) {
URL url;
BufferedInputStream in;
FileOutputStream file;
try {
System.out.println("取网络图片");
String fileName = httpUrl.substring(httpUrl.lastIndexOf("/"));
String filePath = "./pic/";
url = new URL(httpUrl);
in = new BufferedInputStream(url.openStream());
file = new FileOutputStream(new File(filePath+fileName));
int t;
while ((t = in.read()) != -1) {
file.write(t);
}
file.close();
in.close();
System.out.println("图片获取成功");
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
public String getHtmlCode(String httpUrl) throws IOException {
String content ="";
URL uu = new URL(httpUrl); // 创建URL类对象
BufferedReader ii = new BufferedReader(new InputStreamReader(uu
.openStream())); // //使用openStream得到一输入流并由此构造一个BufferedReader对象
String input;
while ((input = ii.readLine()) != null) { // 建立读取循环,并判断是否有读取值
content += input;
}
ii.close();
return content;
}
public void get(String url) throws IOException {
String searchImgReg = "(?x)(src|SRC|background|BACKGROUND)=('|\")/?(([\\w-]+/)*([\\w-]+\\.(jpg|JPG|png|PNG|gif|GIF)))('|\")";
String searchImgReg2 = "(?x)(src|SRC|background|BACKGROUND)=('|\")(http://([\\w-]+\\.)+[\\w-]+(:[0-9]+)*(/[\\w-]+)*(/[\\w-]+\\.(jpg|JPG|png|PNG|gif|GIF)))('|\")";
String content = this.getHtmlCode(url);
System.out.println(content);
Pattern pattern = Pattern.compile(searchImgReg);
Matcher matcher = pattern.matcher(content);
while (matcher.find()) {
System.out.println(matcher.group(3));
this.getHtmlPicture(url+matcher.group(3));
}
pattern = Pattern.compile(searchImgReg2);
matcher = pattern.matcher(content);
while (matcher.find()) {
System.out.println(matcher.group(3));
this.getHtmlPicture(matcher.group(3));
}
// searchImgReg =
// "(?x)(src|SRC|background|BACKGROUND)=('|\")/?(([\\w-]+/)*([\\w-]+\\.(jpg|JPG|png|PNG|gif|GIF)))('|\")";
}
public static void main(String[] args) throws IOException {
String url = "http://www.baidu.com/";
GetContentPicture gcp = new GetContentPicture();
gcp.get(url);
}
}
如有疑问请留言或者到本站社区交流讨论,感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!
# Java读取网页
# Java读取网页并下载图片
# Java从数据库中读取Blob对象图片并显示的方法
# Java实现图片上传到服务器并把上传的图片读取出来
# Java从网络读取图片并保存至本地实例
# Java读取图片EXIF信息的方法
# Java 读取PDF中的文本和图片的方法
# java IO流读取图片供前台显示代码分享
# java读取图片并转化为二进制字符串的实现方法
# 如何使用Java读取PPT文本和图片
# Java技巧:快速获取图片拍摄时间
# 自己的
# 有什么
# 我也
# 在这里
# 尤其是
# 如有
# 很多人
# 无从下手
# 希望能
# 希望大家
# 作为一个
# 这篇
# 能使
# 谢谢大家
# 还请
# 数据采集
# 下载图片
# 大家一起分享
# 判断是否
# 一起成长
相关文章:
三星网站视频制作教程下载,三星w23网页如何全屏?
Python如何创建带属性的XML节点
弹幕视频网站制作教程下载,弹幕视频网站是什么意思?
如何快速搭建自助建站会员专属系统?
如何实现建站之星域名转发设置?
建站主机选择指南:服务器配置与SEO优化实战技巧
建站之星备案流程有哪些注意事项?
陕西网站制作公司有哪些,陕西凌云电器有限公司官网?
自助网站制作软件,个人如何自助建网站?
北京网页设计制作网站有哪些,继续教育自动播放怎么设置?
制作门户网站的参考文献在哪,小说网站怎么建立?
网站插件制作软件免费下载,网页视频怎么下到本地插件?
高性能网站服务器配置指南:安全稳定与高效建站核心方案
教学网站制作软件,学习*后期制作的网站有哪些?
南京做网站制作公司,南京哈发网络有限公司,公司怎么样,做网页美工DIV+CSS待遇怎么样?
在线ppt制作网站有哪些,请推荐几个好的课件下载的网站?
ppt制作免费网站有哪些,ppt模板免费下载网站?
建站之星伪静态规则如何正确配置?
独立制作一个网站多少钱,建立网站需要花多少钱?
如何登录建站主机?访问步骤全解析
如何在阿里云ECS服务器部署织梦CMS网站?
广州建站公司哪家好?十大优质服务商推荐
如何在腾讯云免费申请建站?
建站主机默认首页配置指南:核心功能与访问路径优化
电影网站制作价格表,那些提供免费电影的网站,他们是怎么盈利的?
如何挑选高效建站主机与优质域名?
专业制作网站的公司哪家好,建立一个公司网站的费用.有哪些部分,分别要多少钱?
如何快速搭建高效简练网站?
成都网站制作价格表,现在成都广电的单独网络宽带有多少的,资费是什么情况呢?
如何在建站之星网店版论坛获取技术支持?
专业的网站制作设计是什么,如何制作一个企业网站,建设网站的基本步骤有哪些?
XML的“混合内容”是什么 怎么用DTD或XSD定义
如何在云虚拟主机上快速搭建个人网站?
建站之星安装后界面空白如何解决?
开源网站制作软件,开源网站什么意思?
婚礼视频制作网站,学习*后期制作的网站有哪些?
宝塔建站无法访问?如何排查配置与端口问题?
javascript基本数据类型及类型检测常用方法小结
娃派WAP自助建站:免费模板+移动优化,快速打造专业网站
如何快速上传建站程序避免常见错误?
如何在七牛云存储上搭建网站并设置自定义域名?
制作宣传网站的软件,小红书可以宣传网站吗?
,想在网上投简历,哪几个网站比较好?
如何续费美橙建站之星域名及服务?
如何安全更换建站之星模板并保留数据?
网站建设制作需要多少钱费用,自己做一个网站要多少钱,模板一般多少钱?
如何在搬瓦工VPS快速搭建网站?
,柠檬视频怎样兑换vip?
香港服务器网站卡顿?如何解决网络延迟与负载问题?
,交易猫的商品怎么发布到网站上去?
*请认真填写需求信息,我们会在24小时内与您取得联系。