|
1 year ago | |
---|---|---|
.github | 1 year ago | |
assets | 1 year ago | |
src | 1 year ago | |
tests | 1 year ago | |
usage | 1 year ago | |
.gitignore | 2 years ago | |
.readthedocs.yaml | 1 year ago | |
LICENSE | 2 years ago | |
README.md | 1 year ago | |
requirements-dev.txt | 1 year ago | |
setup.py | 1 year ago |
本项目封装了一套可用于爬取JM的Python API.
你可以通过简单的几行Python代码,实现下载JM上的本子到本地,并且是处理好的图片。
友情提示:珍爱JM,为了减轻JM的服务器压力,请不要一次性爬取太多本子,西门🙏🙏🙏.
本项目的核心功能是下载本子,基于此,设计了一套方便使用、便于扩展,能满足一些特殊下载需求的框架。
除了下载功能以外,也实现了其他的一些禁漫接口,例如登录、搜索、收藏夹等等,按需实现。
目前核心功能实现较为稳定,项目也处于维护阶段(因为禁漫接口经常变动,需要经常维护)。
pip install jmcomic -i https://pypi.org/project --upgrade
pip install git+https://github.com/hect0x7/JMComic-Crawler-Python
使用下面的两行代码,即可实现功能:把某个本子(album)里的所有章节(photo)下载到本地
import jmcomic # 导入此模块,需要先安装.
jmcomic.download_album('422866') # 传入要下载的album的id,即可下载整个album到本地.
# 下载album_id为422866的本子
$ jmcomic 422866
用法多样:
支持网页端和移动端两种客户端实现,可通过配置切换(移动端不限ip兼容性好,网页端限制ip地区但效率高)
支持自动重试和域名切换机制
多线程下载(可细化到一图一线程,效率极高)
可配置性强
请求域名
客户端实现
是否使用磁盘缓存
同时下载的章节/图片数量
图片格式转换
下载路径规则
请求元信息(headers,cookies,proxies)
等可扩展性强
登录插件
硬件占用监控插件
只下载新章插件
压缩文件插件
下载特定后缀图片插件
发送QQ邮件插件
日志主题过滤插件
自动使用浏览器cookies插件
Downloader(负责调度)
Option(负责配置)
Client(负责请求)
实体类
等进阶使用请查阅文档:文档
下面列出一些常用的文档链接:
assets:存放一些非代码的资源文件
src:存放源代码
jmcomic
模块tests:测试目录,存放测试代码,使用unittest
usage:用法目录,存放示例/使用代码