今天发现了一个特别棒的工具—huginn,很实用,应用范围很广,确实是网络工具库中的神器。它可以监控网络上的一切资源,并将这些资源按照你的需要发送给你。实现这一功能只需要简单的配置就可以了。列举一下,huginn 主要的应用场景和功能。 1 跟没有 RSS 的网站定制 RSS 种子 2 监控知乎、微博、贴吧等平台指定的信息,一旦监控到信息,邮件通知你本人 3 监控各大购物平台商品信息,一旦发现折扣信息,邮件通知你 4 支持各种形式的发送和接收 WebHooks。 Huginn 就是私有的 IFTTT,自定义程度非常高,只要你思路开阔,想法够野一定能发挥出巨大的价值。 Huginn 安装Huginn 的安装方法有很多种,我推荐一种,就是通过 docker 安装。原因很简单,安装快,而且这本身就是 docker 的主要应用场景和优势所在。如果是常规安装方式,需要安装依赖包、ruby 环境、数据库、nginx、huginn 及各种配置;但是 docker 就只需要下载 docker 镜像,运行 huginn 容器就可以了。 1 安装 docker 推荐阅读:月付 3-7 刀,质量口碑保证,网络线路优秀的 vps 盘点
Centos7 安装 docker 命令如下: - curl -fsSL https://get.docker.com/ | sh
- systemctl start docker
- systemctl status docker
- systemctl enable docker
注:安装 docker 要求系统内核版本高于 3.0,基本上只能安装在 KVM 架构的 vps 上。 2 运行 huginn 容器 - docker run --name huginn -p 3000:3000 huginn/huginn
注:重启容器会导致数据丢失,请勿轻易应用到生产环境。 Huginn 界面部署成功后访问 IP+3000 端口,出现界面,点击登录,默认账号密码是 admin/password.登录成功后,界面如下 Huginn 使用介绍-以 website agent 采集网页为例简单通过一个例子介绍下 huginn 的使用方法。监控 v2ex 首页第一个帖子,首页第一个帖子变化时,发送邮件通知。 1 新建一个 agent,负责每隔一分钟采集 v2ex 第一个帖子的标题,配置如下。点击 agents->new agent . tpye 选择 website agent,表示从 web 站点采集数据; name 是这个 agent 的名称 schedule 表示多久采集一次,本次设置的是每分钟一次 其他的暂时不用管,重要的是配置 option,即从 v2ex 采集第一个帖子的规则。 需要配置采集地址 url,即 v2ex 首页的网址;v2ex 第一个帖子的 css 定位,可以通过 f12 查看帖子的 xpath,下图所示。 但是获取的 xpath 经常有问题,推荐通过 selectorgadget chrome 扩展去获取定位;再配置获取的内容,我是获取的文字内容,填 normalize-space(.)即可 最后点击“dry run” 测试一下是否可以获取到内容,下图所示即成功。点击 save,保存该 agent 运行几分钟后,可以看到每分钟都能获取到新的 v2ex 帖子。 使用邮件通知 email agent通过以上 v2ex agent 实现了每隔一分钟检测一次首页第一个帖子。然后再尝试一下将 v2ex agent 中的内容通过邮件发布。 需要另外新建一个 agent,type 选择 Email Agent,sources 选择我们之前创建的 v2ex agent,options 中填邮件内容,我们通过{{title}}引入了 v2ex agent 中的 title 字段。这样 v2ex agent 每次检测到内容更新,就会触发 email agent,将更新的内容通过邮件发送到本人。 另外,还需要配置邮件发送接收相关内容。 首先要配置配置 stmp 服务器。然后将 stmp 配置信息写到 huginn 容器的环境变量中去。所以需要用以下方式启动 huginn 容器。 - docker run --name huginn \
- -p 3000:3000 \
- -e SMTP_DOMAIN=163.com \
- -e SMTP_USER_NAME=AAAAAA@163.com \
- -e SMTP_PASSWORD=password \
- -e SMTP_SERVER=smtp.163.com \
- -e EMAIL_FROM_ADDRESS= AAAAAA @163.com \
- huginn/huginn
其次,配置接收邮件人。
|