Happy Harvester 2.5.6.104

许可: 免费试用 ‎文件大小: 1.57 MB
‎用户评分: 5.0/5 - ‎1 ‎评分

关于 Happy Harvester

如果您使用雅虎、谷歌或网络上的企业目录搜索过内容,您可能注意到您的搜索结果通常具有相同的逻辑结构。快乐收割机可以提取此结构化数据,并将其存储在分隔的文件格式。保存数据后,您可以在 Microsoft Excel 或任何其他数据库程序中导入数据。 在提取数据之前,必须分析要获取的 HTML 源。您可以告诉快乐收割机在两个 HTML 字符串之间提取数据。将存储之间的 (文本) 数据。您可以创建多个选择集并提取标题、价格、股票信息等。例如,您可以查询音乐 CD 商店的艺术家、专辑标题和价格,或定期获取库存信息。 对于对多个 Web 地址进行爬网,您可以导入 URL 的列表。或者,您可以使用 URL 生成器构建范围。如果 url 中使用数字的逻辑结构,则最后一个选项可能很有用。许多业务目录、Web 论坛和搜索引擎结果都使用结构化 URL 查询其数据库。一些示例配置文件包含在快乐收割机您的灵感。 特征: - 从网站收集所有类型的数据。 - 简单直观的用户界面。 - 自动浏览包含下一页定义的页面。 - 高级 URL 生成器。 - 收获本地 html 和文本文件。 - 支持具有基本身份验证的网站。 - Http 邮政和 Cookie 管理支持。 - 以 Excel 或 CSV 格式导出数据。 - 收获母版和详细信息页面。 - 具有复杂站点结构脚本规则的高级模式。 - 用于自动计划的命令行选项。 关键词:屏幕刮刀、Web 爬网器、Web 刮刀、Web 提取器、html 解析器、Web 抓取器、数据扩展、Web 内容监控、数据集成