• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    python 爬取吉首大学网站成绩单

    项目地址:

    https://github.com/chen0495/pythonCrawlerForJSU

    环境

    配置及使用

    登陆学校成绩单查询网站,修改cookie.

    按F12后按Ctrl+R刷新一下,获取cookie的方法见下图:

    修改爬虫url为自己的成绩单网址.

    运行src/main.py文件即可在/result下得到csv文件.

    结果展示

    完整代码

    # -*- coding: utf-8 -*-
    # @Time    : 5/29/2021 2:13 PM
    # @Author  : Chen0495
    # @Email   : 1346565673@qq.com|chenweiin612@gmail.com
    # @File    : main.py
    # @Software: PyCharm
    
    import requests as rq
    from bs4 import BeautifulSoup as BS
    import numpy as np
    import pandas as pd
    
    rq.adapters.DEFAULT_RETRIES = 5
    s = rq.session()
    s.keep_alive = False # 关闭多余连接
    
    header = { # 请更改cookie
        'user-agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4501.0 Safari/537.36 Edg/92.0.891.1',
        'cookie' : 'wengine_vpn_ticketwebvpn_jsu_edu_cn=xxxxxxxxxx; show_vpn=1; refresh=1'
    }
    
    # 请更改url
    r = rq.get('https://webvpn.jsu.edu.cn/https/xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx/jsxsd/kscj/cjcx_list', headers = header, verify=False)
    
    soup = BS(r.text,'html.parser')
    
    head = []
    for th in soup.find_all("th"):
        head.append(th.text)
    while '' in head:
        head.remove('')
    head.remove('序号')
    context = np.array(head)
    
    
    x = []
    flag = 0
    for td in soup.find_all("td"):
        if flag!=0 and flag%11!=1:
            x.append(td.text)
        if flag%11==0 and flag!=0:
            context = np.row_stack((context,np.array(x)))
            x.clear()
        flag+=1
    
    context = np.delete(context,0,axis=0)
    data = pd.DataFrame(context,columns=head)
    print(data)
    
    # 生成文件,亲更改文件名
    data.to_csv('../result/result.csv',encoding='utf-8-sig')

    以上就是python 爬取吉首大学成绩单的详细内容,更多关于python 爬取成绩单的资料请关注脚本之家其它相关文章!

    您可能感兴趣的文章:
    • python趣味挑战之爬取天气与微博热搜并自动发给微信好友
    • python 爬取影视网站下载链接
    • Python爬虫之爬取我爱我家二手房数据
    • python 爬取京东指定商品评论并进行情感分析
    • python结合多线程爬取英雄联盟皮肤(原理分析)
    • python爬取豆瓣电影TOP250数据
    • python爬取链家二手房的数据
    • 教你怎么用python爬取爱奇艺热门电影
    • Python爬虫之爬取最新更新的小说网站
    • Python爬虫实战之爬取携程评论
    上一篇:python 批量压缩图片的脚本
    下一篇:Pytorch DataLoader shuffle验证方式
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    python 爬取吉首大学网站成绩单 python,爬取,吉首,大学网站,