就是从网页 抓取的链接 以及图片文字放到自己的网页上 求解 求各位大神帮帮我
问题描述:
就是从网页 抓取的链接 以及图片文字放到自己的网页上 求解 求各位大神帮帮我
答
用html超链接可以直接跳到任何网站
答
先抓网页的全部数据,拿出来后正则匹配你要的内容
答
可以考虑用python做爬虫部分,将爬取的url等信息写入数据库,图片下载到本地,防止加载图片出现无法使用的情况,数据图片都爬回来之后,加载到自己网页上就非常简单了
答
分两个项目做:
第一个项目:
1、用HttpUtil或者WebClient抓取页面,需要目标网站的URl
2、将得到的page对象用jsoup通过page中的节点进行解析,得到自己需要的东西(page为HttpUtil中用来代表当前页面的java对象,图片在数据库中存的可以是目标网页上原本的图片url)
3、将得到的东西封装进实体中,并存入数据库
第二个项目:
1、搭建框架环境,将数据库中的东西呈现到页面上