CG Enterprise 是当今市场上领先的企业 Web 数据提取解决方案,为大规模运营提供了无与伦比的支持。它专为严重依赖结构化 Web 数据、法律合规性、需要数据质量和可靠性的公司而设计。 它包括用于监控数据提取成功标准、法律合规性和生产故障转移的复杂功能,这些功能在其他解决方案中不可用。CG Enterprise 包括全套组件,用于在您自己的云或数据中心环境中运行大型 Web 数据提取操作。 以下是我们为什么认为您会喜欢它的快速快照: - 从零开始构建,实现最佳性能、可扩展性和可靠性。 - 代理控制中心 - 提供代理、服务器、安全性、软件升级、计划、部署、用户访问、代理、支持票证、代理版本控制存储库以及任何计划或部署更改的审计跟踪的集中管理。 - 卓越的性能。 - 非常直观的视觉编辑器,可自动检测和配置所需的命令。 - 企业级调试、日志记录、错误处理和错误恢复功能。 - 细粒度数据验证和成功标准,允许团队指定有关如何在运行时检测和处理数据质量问题的规则。 - 重复数据消除。 - 设备指纹匿名化。 - 跨会话进行强大的代理轮换。 - 费率限制。 - 复杂的解析器处理、多线程和会话管理。 - 丰富的 API,它暴露了集成团队需要的众多点。 - 多样化的出口目标(即镶木地板、JSON)。 - 多种交付方法(亚马逊 AWS S3、Azure、宇宙 DB、SFTP)。 - 支持大多数数据库(即包括玛丽亚DB、MongoDB、Cosmos)。 - 远程控制支持软件升级。 - 丰富的错误检测和错误处理控制与高级恢复和重新启动配置控制。
版本历史记录
- 版本 2.71.1 发布于 2020-05-19
CG Enterprise 是当今市场上领先的企业 Web 数据提取解决方案,为大规模运营提供了无与伦比的支持。它专为严重依赖结构化 Web 数据、法律合规性、需要数据质量和可靠性的公司而设计。 - 版本 1.17.7 发布于 2016-01-26
内容抓取器是一个新的高级网络刮擦和 Web 自动化工具 - 这是初始版本之一。