中国裁判文书网爬虫

A spider for China Judgements Online

It is only used for personal study and technical exchange, and cannot be used for commercial purposes.

Overview

Features

Support IP proxy
Support multiple processes
Support full crawling
Divide data according to decision time and province

Run

python spider.py -num_processes 1 -start_time 2016-1-2 -end_time 2016-1-2

Result

raw data

processed data

If you have any questions, please open an issue.

Welcome to pull requests to improve this project!

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
data		data
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
result1.jpg		result1.jpg
result2.jpg		result2.jpg
spider.py		spider.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

中国裁判文书网爬虫

A spider for China Judgements Online

Overview

Features

Run

Result

About

Uh oh!

Releases

Packages

Languages

License

xfsprogram/spider

Folders and files

Latest commit

History

Repository files navigation

中国裁判文书网爬虫

A spider for China Judgements Online

Overview

Features

Run

Result

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages