无代码爬虫
搞了半天的PlayWright, 忽然想到这不应该有无代码的爬虫工具么? 比如叫数据采集器
? Data Collector
?
查了一下国内的火车头采集器
和国外的有些采集器真的收费不菲, 然后就发现Chrome应用商店里有crx应用, 尝试了1个, 发现真香,哈哈.
名称: Instant Data Scraper
和 NoCoding Data Scraper - Easy Web Scraping
这里还有一篇文章https://zapier.com/blog/best-data-collection-apps/介绍了5个, 不过还没有细看.
Instant Data Scraper
尝试了Instant Data Scraper
, 体验很好, 非常好用. 强烈推荐.
它的特点是可以对翻页表格数据和无限流数据进行爬取, 配置速度极快. 问题是不能爬取表格内的详情页.
基本使用方式: 点击try another table
, 切换到数据区域后, 点击Locate "next" button
, 选择下一页按钮, 如果是无限流页面,则选择无限流, 然后对列进行删减选择, 点击start crawling
开始爬取.
网站 | 特殊爬取方式 |
---|---|
淘宝 | 搜索关键词后, 需要把页面切换为列表 显示方式. 可以爬到价格 |
京东 | 需要使用m.jd.com 网址爬取, 无限流方式. 可以爬到价格 |
Web Scraper - Free Web Scraping
它就可以一级一级的深入到详情页爬取, 相对强大一些, 但配置起来也也要慢一些. 每一个要爬取的参数都要单独配置.
油猴
油猴里搜索scraper也有一些脚本. 有空可以体验.