就是从网页 抓取的链接 以及图片文字放到自己的网页上 求解 求各位大神帮帮我

就是从网页 抓取的链接 以及图片文字放到自己的网页上  求解 求各位大神帮帮我

问题描述:

就是从网页 抓取的链接 以及图片文字放到自己的网页上 求解 求各位大神帮帮我

java的话,用jsoup去爬别人网站信息,在java里获取,再放到自己的页面

java爬取网页内容 简单例子(2)——附jsoup的select用法详解

用html超链接可以直接跳到任何网站

先抓网页的全部数据,拿出来后正则匹配你要的内容

可以考虑用python做爬虫部分,将爬取的url等信息写入数据库,图片下载到本地,防止加载图片出现无法使用的情况,数据图片都爬回来之后,加载到自己网页上就非常简单了

分两个项目做:
第一个项目:
1、用HttpUtil或者WebClient抓取页面,需要目标网站的URl
2、将得到的page对象用jsoup通过page中的节点进行解析,得到自己需要的东西(page为HttpUtil中用来代表当前页面的java对象,图片在数据库中存的可以是目标网页上原本的图片url)
3、将得到的东西封装进实体中,并存入数据库
第二个项目:
1、搭建框架环境,将数据库中的东西呈现到页面上