Octoparse 6.4.1

许可: 免费 ‎文件大小: 56.62 MB
‎用户评分: 2.5/5 - ‎1 ‎评分

关于 Octoparse

Octoparse 是一个免费的客户端 Windows Web 刮擦软件,可将网站中的非结构化或半结构化数据转换为结构化数据集,无需编码。 它是一种易于使用的 Web 刮取工具,可从 Web 收集数据。在 Octoparse 中运行的爬网程序由配置的提取规则确定。提取规则将告诉 Octoparse:哪个网站将开放;您计划爬网的数据在哪里,等等提供高速数据收集,最多执行 10 个并发线程。 作为 Windows 应用程序,Octoparse 适用于静态和动态网站,包括那些网页正在使用 Ajax 的网站。您选择的导出格式有多种,如 CSV、EXCEL、HTML、TXT 和数据库(MySQL、SQL Server 和 Oracle)。Octoparse 模拟人工操作以与网页交互。 其显著功能,如填写表单,在文本框中输入搜索词等,将更容易提取网络数据。您可以在自己的计算机上(本地提取)或云(云提取)中运行提取项目。 Octoparse 提供了一个可视化操作窗格,它非常用户友好和直接。Octoparse 模拟人类 Web 浏览行为,如打开网页、登录帐户、输入文本、指向并单击 Web 元素等。只需在内置浏览器中点击网站上的信息并执行提取,即可获得所需的结构化数据。 基于分布式计算同时大规模刮网是 Octoparse 最强大的功能。将配置项目上载到云后,可以选择使用多个云服务器同时执行提取。如果您需要在短时间内刮取 10,000 个网页,那么 Octoparse 云服务最适合您。