博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
試用 Golang 抓取網站價錢
阅读量:6839 次
发布时间:2019-06-26

本文共 1073 字,大约阅读时间需要 3 分钟。

hot3.png

export GOPATH=$(pwd)  go get github.com/PuerkitoBio/goquery  go run test.go

package main  import (     "fmt"     "github.com/PuerkitoBio/goquery"     "strings"     "regexp"     "time" )  const (     TARGET_URL = "http://www.example.com/goods/show/99" )  func main() {     var document *goquery.Document     var e error         if document, e = goquery.NewDocument(TARGET_URL); e != nil {         panic(e.Error())     }         name  := strings.TrimSpace(document.Find("table.jmb tr").Eq(2).Find("td span").First().Text())     price := strings.TrimSpace(document.Find("table.jmb tr").Eq(2).Find("td span").Last().Text())         matches := regexp.MustCompile(`(\d+).*=.* (\d+).*=.*`).FindAllStringSubmatch(price, -1)[0]      price1b  := matches[1]     price10b := matches[2]         fmt.Printf(         "%-30s %-30s %-30s %-20d %-30s\n", name, price1b, price10b,         time.Now().Unix(), time.Unix(time.Now().Unix(), 0).Format("2006-01-02 15:04:05")) }- See more at: http://www.actkr.com/?p=1299#sthash.YZStcb4C.xtGqd6Hh.dpuf

转载于:https://my.oschina.net/goulang/blog/174083

你可能感兴趣的文章
AndroidStudio下加入百度地图的使用 (三)——API基本方法及常量属性
查看>>
Oracle 12C -- CDB的启动过程
查看>>
python---连接MySQL第四页
查看>>
tiny6410nfs挂载问题
查看>>
ecshop mobile 文件介绍
查看>>
C# 中经常用到的HTTP请求类,已封装get,post,delete,put
查看>>
php 统计fasta 序列长度和GC含量
查看>>
Criteria 和 DetachedCriteria的区别与使用
查看>>
Swift - 20 - 字典的基础操作
查看>>
OC MRC之 @property参数(代码分析)
查看>>
通过拆分,提高表的访问效率
查看>>
centos 邮件服务 腾讯企业邮箱(免费) 使用iRedmail 需要有公网的centos主机 发邮件协议:smtp 端口25 收邮件协议:pop3 端口110 iredmail安装配置 ...
查看>>
多线程注意点
查看>>
C++基础学习教程(七)----类编写及类的两个特性解析--->多态&继承
查看>>
Atitit.单向sso 单点登录的设计与实现
查看>>
统计学如何用少量数据概括数据(相关概念)
查看>>
程序自信
查看>>
sqlite性能简单測试
查看>>
HBM内存介绍
查看>>
查看Mac电脑的开机记录
查看>>