• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    Java 获取URL的内容
    Java获取URL内容的,我这里只给出GET方式的,POST和其它方式的都是比较类似的。其技术要点就一下三点。
    第一:创建HttpURLConnection
    第二:打开URL,创建一个InputStream
    第三:逐行(逐字节)读取,如果需要,转换编码,放入字符串。
    好,一下就开始代码吧:
    复制代码 代码如下:

    public String getUrlContent(String path){
    String rtn = "";
    int c;
    try{
    java.net.URL l_url = new java.net.URL(path);
    java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection();
    l_connection.setRequestProperty("User-agent","Mozilla/4.0");
    l_connection.connect();
    InputStream l_urlStream = l_connection.getInputStream();
    while (( ( c= l_urlStream.read() )!=-1)){
    int all=l_urlStream.available();
    byte[] b =new byte[all];
    l_urlStream.read(b);
    rtn+= new String(b, "UTF-8");
    }
    //Thread.sleep(2000);
    l_urlStream.close();
    }catch(Exception e){
    e.printStackTrace();
    }
    return rtn;
    }

    其中
    l_connection.setRequestProperty("User-agent","Mozilla/4.0");
    这句是必须的,很多服务器对于没有User-agent头的请求直接403了就。
    然后采用InputStream.available()来一次性读取,返回此输入流方法的下一个调用方可以不受阻塞地从此输入流读取(或跳过)的字节数,如果需要的话,可以在后面稍微Sleep一下线程:
    Thread.sleep(2000);
    其中的
    复制代码 代码如下:

    while (( ( c= l_urlStream.read() )!=-1)){
    int all=l_urlStream.available();
    byte[] b =new byte[all];
    l_urlStream.read(b);
    rtn+= new String(b, "UTF-8");
    }

    是个很重要的读取过程,c表示读取流的标注,当结束的时候是-1,然后all是本次循环可用的最大字节数目,然后读取全部可用字节到byte[] b中,然后转换成UTF-8类型的字符串,注意,这里可以自己写方式,如果读取GB2312,就要写GB2312,至于有没有万能的,可以获取Meta,匹配下。自己想办法吧。
    您可能感兴趣的文章:
    • java 页面url传值中文乱码的解决方法
    • Java在web页面上的编码解码处理及中文URL乱码解决
    • java URL乱码的解决办法
    • 解决java页面URL地址传输参数乱码的方法
    • java中文乱码之解决URL中文乱码问题的方法
    • java发送url请求获取返回值的二种方法
    • java解析出url请求的路径和参数键值对类(解析出url请求的路径,包括页面)
    • Java使用默认浏览器打开指定URL的方法(二种方法)
    • java网络编程中向指定URL发送GET POST请求示例
    • Java中URL传中文时乱码的解决方法
    上一篇:java struts常见错误以及原因分析
    下一篇:JAVA (Jsp)利用Google的Translate开发API的代码
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    Java 获取URL的内容 Java,获取,URL,的,内容,Java,