16/10/6 更新进度

B站UP主相关项目虽然整个项目已经完成,但是由于我代码写的太随性。想在规范之后再继续下去。而且想使用MongoDB,所以暂停更新,等我有能力将代码组织的好看一点会继续更新下去。

最近在研究django,接下来的几篇blog应该是django的翻译,原文地址如下:

编写你的第一个Django应用程序,第1部分

大概第一章会在这星期内放出。

 

发现更多的B站UP主——爬虫+简易数据挖掘(1)

整个项目使用python3、PHP、和MariaDB

整个项目的具体思路是:

  1. 爬取所有bilibili的用户,筛选出level6的用户,存入数据库。
  2. 处理所有UP主的投稿倾向。
  3. 用户输入自己的B站ID。
  4. 爬取该用户的关注列表。
  5. 获取关注列表中所有level6的UP主的投稿倾向。
  6. 针对不同倾向的UP主进行分类统计。
  7. 获取各个分区中和用户口味最相近且用户尚未关注的UP主,并推荐给用户。

继续阅读发现更多的B站UP主——爬虫+简易数据挖掘(1)

python 爬取现充Shell的成绩单

以前一直都是照着别人的爬虫进行修改实验,这次自己亲手查请求包看源码完成了一个爬虫。写篇blog纪念一下(

具体需求是@ShellBin想要帮女朋友查成绩,但是他女朋友不记得她自己的学籍号了,查成绩需要身份证号和学籍号,缺一不可,于是,他想要爆破查成绩。
继续阅读python 爬取现充Shell的成绩单