发现更多的B站UP主——爬虫+简易数据挖掘(1)

整个项目使用python3、PHP、和MariaDB

整个项目的具体思路是:

  1. 爬取所有bilibili的用户,筛选出level6的用户,存入数据库。
  2. 处理所有UP主的投稿倾向。
  3. 用户输入自己的B站ID。
  4. 爬取该用户的关注列表。
  5. 获取关注列表中所有level6的UP主的投稿倾向。
  6. 针对不同倾向的UP主进行分类统计。
  7. 获取各个分区中和用户口味最相近且用户尚未关注的UP主,并推荐给用户。

继续阅读发现更多的B站UP主——爬虫+简易数据挖掘(1)

python 爬取现充Shell的成绩单

以前一直都是照着别人的爬虫进行修改实验,这次自己亲手查请求包看源码完成了一个爬虫。写篇blog纪念一下(

具体需求是@ShellBin想要帮女朋友查成绩,但是他女朋友不记得她自己的学籍号了,查成绩需要身份证号和学籍号,缺一不可,于是,他想要爆破查成绩。
继续阅读python 爬取现充Shell的成绩单