易搜采集器

专业提供网页数据采集服务,定制采集加微信或QQ详谈

Example Image

扫码加微信获取采集软件

企业QQ在线客服

版本:2.0.2.3

系统要求:Windows 7/8/10/11

运行环境【win7系统需要安装】: 点击下载(Net Framework 4.6)

新一代智能爬虫软件

简单易用,通过智能算法+可视化界面,内量大量模板,只需简单设置,轻松点击鼠标,即可采集数据。

图片文件,文本文件,视频文件批量下载

可以自动下载图片、PDF、DOCX等各种文件,并且支持自定义保存目录、自定义文件名称。

灵活通用

99%网站可以采集,静态网页、动态页面、单页应用、手机APP都可以抓取,GET、POST都可以采集

高速采集

内置高效浏览器引擎、HTTP引擎、JSON引擎,经过极致优化的内核,多线程采集,快速如飞。

为什么选择易搜网页数据采集器

可采集99%的网页上显示的数据,国内国外均可

功能强大 操作简单

采集功能强大且可存储的任务数无上限,实现全行业、全场景、全类型的互联网数据采集。

  • 全行业:电商、新闻、社交媒体、招投标、金融、房产等行业网站

  • 全场景:列表页、详情页、搜索页、瀑布流页、登录等采集场景

  • 全类型:文本、图片、链接、视频、源码、Json等数据类型

内置海量采集模板

内置大量网站采集模板,覆盖多个行业,点击模板,即可加载数据,只需简单配置,就可快速准确获取数据,满足各种采集需求.

  • 自助模式:选取自己所需要的采集规则,通过设置关键词,就可以轻松采集需要的数据

  • 条件触发:设置采集触发条件,满足条件的数据才会被采集

  • 定时采集:支持项目在指定时间内进行多单次或多次重复采集

  • 自动去重:字段级别的新采集数据自动与原有数据对比去重





自研智能算法

通过自研的智能识别算法,可以自动识别列表数据识别分页,准确率达到95%,可以深入采集多级页面,快速准确的获取数据。

  • 全程自动化实现列表页数据采集

  • 全程实现自动化列表页+详情页数据采集

  • 同时还可以实现POST数据及AJAX数据展方式的自动化提取

数据多种导出格式

数据可以自动导出发布,支持多种格式导出,TXT、CSV、Excel、Access、MySQL、SQLServer、SQLite以及发布到网站接口(Api)等。

  • 轻量使用者:可以选择导出表格文件或者TXT文本数据

  • 企业级使用者:可选择将数据导出到数据库,加快数据的收集整理

  • 互联网从业者:爪取海量代码从而丰富并提升自己的编程技巧

软件应用场景

软件使用场景比较广泛,大致有以下几种情况

电子商务领域

随着电子商务的高速发展,软件可以采集国内外任意电商网站,如同类商品的属性、评价、价格,市场销 量占比等数据,可对评论信息进行典型意见提取,情感分析,从而得出客观 的市场评价及分析,优化运营,根据同类经验制造爆款,开展业务活动,提升网店的运营水平与效率。

生活服务领域

科技发展与我们生活紧密相连,简单说,吃饭旅行直接团购网,外卖网,简单高效。可以采集美团,饿了么,赶集网,大众点评,途牛,携程等各类生活服务网站,采集同类的属性、评价、价格,销量,评分等数 据,通过软件可对评论信息进行典型意见提取,情感分析,数据对比,从而更方便 更快捷的为我们的衣食住行做出合适的选择。

政府单位领域

在全社会信息量爆炸式增长的背景下,政府机关对于数据的收集和利用也愈加重视起来,某气象中心通过易搜网页数据采集器汇集到各地区的各类气象相关监测数据, 通过数据对比 分析,及时预警最新气象活动分布范围,指导相 关部门做好应对措施。

购买

软件操作简单·功能强大·满足你的所有需求,且支持定制

软件功能 定制 详谈 半年版 Hot 598元 年版 Plus 998
支持浏览器引擎、HTTP引擎和JSON引擎三种模式
支持批量生成起始网址
自动识别列表和分页,自动生成采集字段
支持过滤空值
支持数据处理
支持自定义过滤列表
支持自定义字段值
支持自定义浏览器UserAgent、禁止弹窗等设置
支持代理IP,VPN、ADSL拨号等设置
数据可导出为EXCEL、TXT、HTML文件

常见问题

如果在采集过程中遇到问题可以随时联系客服进行指导解决。

企业QQ在线客服

采集时弹出验证码怎么办?

一般采集时如果遇到验证码,我们可以通过设置验证码检测功能来解决。具体验证码教程,参考验证码检测,可以使用手动输入验证码,也可以通过第三方打码平台解决
有些网站设置了反爬虫策略,当我们采集速度太快,就会触发反爬虫策略,然后网页弹出验证码、访问错误之类的提示信息。任务编辑器,第三步设置,高级设置;在浏览器引擎下,我们只需要设置间隔时间,时间单位是毫秒,1000毫秒=1秒。 具体间隔时间,可以根据网站,多测试调整,在不触发反爬虫策略的同时,最大效率提供抓取速度。
在Fiddler界面的左侧请求列表,找到目标网站的请求,选中请求。在软件右侧,选择Inspectors -->Raw;全选Raw中的文本,复制 ctrl+c;打开易搜网页数据采集器 -->规则编辑器 -->第三步设置 -->指定Http Header,点击按钮从剪切板粘贴
从官方网站下载的易搜网页数据采集器,如果发生提示木马的情况,这属于杀毒软件的误报。 (目前仅在装有360的电脑上发现这种情况)
在杀毒软件中给易搜网页数据采集器添加白名单,或者退出杀毒软件。就可以解决。