Skip to content

TimmaWang/PictureCrawl

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 

Repository files navigation

PictureCrawl

  • two versons:Windows and Linux
  • language:C++
  • can crawl all of pictures from a seed url , also can crawl pdf with some modification

图片爬虫

  • 包括windows和Linux两个版本,目前windwos版本已经完成
  • 语言:C++

给定一个种子URL,能够建立4个爬虫来爬取网页上的图片,图片没有直接下载,而是将图片链接保存下来, 后期可以根据链接直接下载,本人写了一个java的图片下载程序,主要用于后期的以图搜图工作,windows版本包含项目所有的.h文件和.cpp文件,直接在vs中新建项目,编译运行即可。

注意的是,需要在项目的当前目录下新建一个seed.txt,存放种子URL

扩展

  • linux版本正在写,敬请期待
  • java的图片下载程序已经完成,等到将图片匹配算法修改完成后,一并上传

About

can crawl all of pictures from a seed url

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published