Arch Search Engine 1.15

许可: 免费 ‎文件大小: 31.07 MB
‎用户评分: 3.5/5 - ‎2 ‎评分

Arch 是 Apache Nutch(一种广受欢迎的、高度可扩展的通用搜索引擎)的开源扩展,用于内部网搜索。对公司搜索引擎不满意?这并不奇怪,很少有人是。据我们所知,没有像谷歌的全球网络搜索那样起作用的内联网引擎。这有其根本原因:谷歌在全球网络(或类似网站)使用的算法在内部网上几乎不起作用,因为缺乏统计数据。拱门(最后!它使用一种新颖的方法提供高精度的搜索结果,效果很好。不相信吗?包括盲测试评估工具。您可以使用盲测试方法部署 Arch 并将其性能与当前搜索引擎和/或 Google(在您的网站的公共部分)进行比较。 除了卓越的搜索质量外,Arch 还具有许多对企业环境至关重要的功能: - 文档级安全性。用户只能找到他们有权查看的文档。 - 便宜的索引更新。Arch 能够使索引保持最新,并避免定期完成网站重新爬写。 - 24/7 可用。即使爬网失败,也始终有可用的工作索引。 - 支持同时编制索引和搜索多个网站,如果需要,可以单独搜索和管理任何网站。动态添加和删除网站很容易。 - 自动生成的站点目录。 - 部署后提供低成本支持。 - 双接口(PHP 和 Java),便于部署和自定义。 - 分面搜索 "开箱即用"开箱即用。 - 一组广泛且可扩展的解析器,用于分析各种文件格式:HTML、PHP、PDF、MS Office、开放办公室等。 - 一个模块化的,基于插件的架构,可以很容易地定制和扩展。 - 包含源代码。 - 高性能和可扩展性。Arch 可以在计算机群集上运行,以索引非常大的数据集。

版本历史记录

  • 版本 1.15 发布于 2019-05-17
    在 Nutch 1.15 上移植
  • 版本 1.9.2 发布于 2016-08-18
    改进的文档解析,在 Nutch 1.9 上移植。
  • 版本 1.2 发布于 2010-09-17
    移植到 Apache Nutch 1.2,升级了 PDF 解析器,添加了测试和调优工具,解决了测试版中的问题,启用了计算机群集的使用。

软件信息