分类目录Gecco

[Gecco]Java爬虫框架Gecco入门教程

一、介绍

萌生出来的写爬虫的心里,是有一次我在写Springjpa的小Demo的时候,苦于没有数据,想了想博客这种数据类型能够符合我的需求,所以想要通过爬虫把我博客里面的数据爬出来(其实可以通过数据库,但是自我感觉不优雅)。
找了找以前自己笔记中比较出名的Java爬虫框架,排在第一位的就是这个框架了Gecco,据我以前了解到这是一款只要定义好vo类配以jq选择器风格的注解就可以拿到我们自己想要的逻辑,一时兴起拿起键盘就开始看了。

官方介绍: Gecco是一款用java语言开发的轻量化的易用的网络爬虫。Gecco整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等优秀框架,让您只需要配置一些jquery风格的选择器就能很快的写出一个爬虫。Gecco框架有优秀的可扩展性,框架基于开闭原则进行设计,对修改关闭、对扩展开放。

阅读更多