pydocrawl 自动从网站下载 pdf - 、ps 和文档文件。必须给出初始 URL 和单词列表。多线程信息挖掘(收集)工具完全用 Python 编写。版本 0.1 在 Linux 和 Cygwin 上成功运行。
版本历史记录
- 版本 r20040925_v1 发布于 2004-09-24
若干修复和更新 - 版本 r20040925_v1 发布于 2004-09-24
软件信息
- 软件分类: 网络与互联网 > 其他
- 发布者: pydocrawl.sf.net
- 许可: 免费
- 价格: N/A
- 版本: 20040925
- 适用平台: windows