老掉牙紫竹——一段将网页静态化的代码
老紫竹——一段将网页静态化的代码。
不多说,直接看源代码,思路很简单,用URLConnection读取页面,然后保存就行了。
import java.io.BufferedReader;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLConnection;
/**
* 一段将网页静态化的代码。
*
* @author 老紫竹 JAVA世纪网(java2000.net)
*
*/
public class Test {
/**
* 将信息转化为静态html
*
* @param sUrl
* 动态信息访问URL
* @param charset
* 编码类型
* @param sSavePath
* 存储为静态文件的目录
* @param sHtmlFile
* 生成的静态文件名,可以按信息的唯一ID+.html命名
* @throws IOException
*/
public static void convert2Html(String sUrl, String charset,
String sSavePath, String sHtmlFile) throws IOException {
int HttpResult;
URL url = new URL(sUrl);
URLConnection urlconn = url.openConnection();
// 抽象类 URLConnection
// 是所有类的超类,它代表应用程序和 URL
// 之间的通信链接,通过在 URL 上调用
// openConnection 方法创建连接对象
urlconn.connect(); // 使用 connect 方法建立到远程对象的实际连接
HttpURLConnection httpconn = (HttpURLConnection) urlconn;
// 每个
// HttpURLConnection
// 实例都可用于生成单个请求,
// 但是其他实例可以透明地共享连接到
// HTTP 服务器的基础网络
HttpResult = httpconn.getResponseCode();
// getResponseCode可以从 HTTP
// 响应消息获取状态码
if (HttpResult != HttpURLConnection.HTTP_OK) {
} else {
InputStreamReader isr = new InputStreamReader(httpconn.getInputStream(),
charset);
BufferedReader in = new BufferedReader(isr);
String inputLine;
if (!sSavePath.endsWith("/")) {
sSavePath += "/";
}
FileOutputStream fout = new FileOutputStream(sSavePath + sHtmlFile);
while ((inputLine = in.readLine()) != null) {
System.out.println(inputLine);
fout.write((inputLine+"\n").getBytes());
}
in.close();
fout.close();
}
}
public static void main(String[] args) throws IOException {
Test ru = new Test();
String filePath = ru.getClass().getResource(".").getPath().toString(); // 取得项目根目录
convert2Html("http://www.java2000.net/", "UTF-8", filePath + "/",
"aaaa.htm");
}
}
不多说,直接看源代码,思路很简单,用URLConnection读取页面,然后保存就行了。
import java.io.BufferedReader;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLConnection;
/**
* 一段将网页静态化的代码。
*
* @author 老紫竹 JAVA世纪网(java2000.net)
*
*/
public class Test {
/**
* 将信息转化为静态html
*
* @param sUrl
* 动态信息访问URL
* @param charset
* 编码类型
* @param sSavePath
* 存储为静态文件的目录
* @param sHtmlFile
* 生成的静态文件名,可以按信息的唯一ID+.html命名
* @throws IOException
*/
public static void convert2Html(String sUrl, String charset,
String sSavePath, String sHtmlFile) throws IOException {
int HttpResult;
URL url = new URL(sUrl);
URLConnection urlconn = url.openConnection();
// 抽象类 URLConnection
// 是所有类的超类,它代表应用程序和 URL
// 之间的通信链接,通过在 URL 上调用
// openConnection 方法创建连接对象
urlconn.connect(); // 使用 connect 方法建立到远程对象的实际连接
HttpURLConnection httpconn = (HttpURLConnection) urlconn;
// 每个
// HttpURLConnection
// 实例都可用于生成单个请求,
// 但是其他实例可以透明地共享连接到
// HTTP 服务器的基础网络
HttpResult = httpconn.getResponseCode();
// getResponseCode可以从 HTTP
// 响应消息获取状态码
if (HttpResult != HttpURLConnection.HTTP_OK) {
} else {
InputStreamReader isr = new InputStreamReader(httpconn.getInputStream(),
charset);
BufferedReader in = new BufferedReader(isr);
String inputLine;
if (!sSavePath.endsWith("/")) {
sSavePath += "/";
}
FileOutputStream fout = new FileOutputStream(sSavePath + sHtmlFile);
while ((inputLine = in.readLine()) != null) {
System.out.println(inputLine);
fout.write((inputLine+"\n").getBytes());
}
in.close();
fout.close();
}
}
public static void main(String[] args) throws IOException {
Test ru = new Test();
String filePath = ru.getClass().getResource(".").getPath().toString(); // 取得项目根目录
convert2Html("http://www.java2000.net/", "UTF-8", filePath + "/",
"aaaa.htm");
}
}
1 楼
仅此而已
2011-05-18
学习了。 感谢分享