# hit-spider **Repository Path**: SimonFighter/hit-spider ## Basic Information - **Project Name**: hit-spider - **Description**: 哈工大各种爬虫。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2024-04-15 - **Last Updated**: 2024-04-15 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # HIT-spider ## 目录结构 - hitwlan.py 登陆HIT-WLAN的脚本(需要自己的账号密码..不是test) - jwc.py 教务处上搞事情的脚本 - 爬成绩 - 爬照片 - 选课,退课 - login.py 新版认证登录 - today.py 今日哈工大刷票 - tice.py 爬体测网站(可得到身份证身高体重等..) - somersa.py 知乎上找到某rsa加密 ## 说明 根目录下config.py.bak重命名为config.py,然后将里面的学号,密码填上,才能正常运行 学校的网站,可能发生变化,,所以这些东西都是有时效性的。 第一次登录可能会失败,原因不知,再跑一次就没有问题。还有,文化素质课是新设的,不确定可以。愿意测试的联系我。qq:519043202 大家可以给我发issue来提意见。。比如说想做个爬某个班的成绩,爬课表啥的。。 前前段时间作者被查水表了。向教务处供出了选课bug,所以以后可能被修复.... 前段时间作者又被查水表了,请大家一定要注意密码保护,不要泄露哈工大相关的个人密码在网络上。然后本人已经从哈工大毕业,无法继续维护,并且能力有限代码质量堪忧,请合理使用。 ### 选课说明 调用 ```python c.xuanke("2016-2017-2-13SD28002200-001","xx",'100') ``` 第一个参数为课程编号,第二个参数为课程代码。参见楼下(就人文社科特别点..),第三个参数可有可无是用来投权重的。 课程有分两种,一种直接点选课的,一种要投权重的(权重其实没必要抢,现在也没条件测试。。so.. | 课程类型 | 代码 | | ------ | ---- | | 限选 | xx | | 创新实验 | cxsy | | 体育 | ty | | 英语 | yy | | 人文社科限选 | tsk | | 创新研修 | cxyx | | 素质限选 | szxx | | 素质核心 | szhx | 有一些特殊的玩法,涉及一点不好的事,所以就不公开了,有意者私聊。比如说~~非选课时间选课~~。 退课时需要修改学期。比如说下面第四行的。代表2016-2017学年第二个学期。以此类推。 ```python # 第100行开始 data = { 'rwh' : cid, 'pageXklb' : lb, 'pageXnxq':'2016-20172', 'pageNj': '', 'pageYxdm': '', 'pageZydm': '', 'pageKcmc': '', } ``` ## 刷票说明 shua的第一个参数为新闻页面链接,第二个参数是刷票次数。 成功次数不定。基本还是很好用的。 没有试过大量刷票,自重。。 ## 体测网站爬虫说明 现在以1140340101账号登录,这个同学没有来哈工大读书但是这个账号还留着。不要随便改密码,谢谢。 只能爬取没有修改默认密码的人的账号,且目前没有做异常处理~(懒 在第27,28行输入你的账号密码(或者用我提供的1140340101账号不要改 main(xxxxxx) xxxxx为你想爬取的学号即可。结果如下 ``` sid: 1140340116 id: 35018xxxxxxx8195X height: 173.6 weight: 66.0 ``` ## 详细说明 见我的博客,[正在编写ing..](http://tmn07.com/hexo)