[Gecco]Java爬虫框架Gecco入门教程

一、介绍

萌生出来的写爬虫的心里,是有一次我在写Springjpa的小Demo的时候,苦于没有数据,想了想博客这种数据类型能够符合我的需求,所以想要通过爬虫把我博客里面的数据爬出来(其实可以通过数据库,但是自我感觉不优雅)。
找了找以前自己笔记中比较出名的Java爬虫框架,排在第一位的就是这个框架了Gecco,据我以前了解到这是一款只要定义好vo类配以jq选择器风格的注解就可以拿到我们自己想要的逻辑,一时兴起拿起键盘就开始看了。

官方介绍: Gecco是一款用java语言开发的轻量化的易用的网络爬虫。Gecco整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等优秀框架,让您只需要配置一些jquery风格的选择器就能很快的写出一个爬虫。Gecco框架有优秀的可扩展性,框架基于开闭原则进行设计,对修改关闭、对扩展开放。

阅读更多

[MySql]mysql维护-mysql开启binlog教程


每一个工程师特别是网络工程师基本会遇到一个问题:自己在测试的时候稍微一个不小心把生产数据库里面的数据给删除了该咋办?比如忘了加上一个限制条件把整个User表给update了,这事大了,找部门经理?他可能比你还不懂。一个一个修改?这效率也太低了再说你咋记得之前的数据是怎样的呢?

所以MySQL提供了一个功能:binlog。顾名思义就是二级制的日志,这里记录了你每个操作,如果误删除了一个什么样的东西,没事,可以找回来的。

一、查看是否开启了log_bin

show variables like ‘log_%’;

阅读更多