蜜蜂采集器2024最新版是一款拥有强大采取功能的软件,用户可以使用本软件对网页上的各种数据信息进行快速的采集,软件使用十分简单轻松,上手进行使用,软件支持自动化采集功能,能够对各种数据实行自动的采集整理,软件支持多种传输下载方式,能够快速获取各种文件,支持对多种数据格式文件的采集,拥有多种管理器进行管理,同时支持对各种文章进行本地保存。
蜜蜂采集器2024最新版使用方法
使用蜜蜂采集器非常简单,只需按照以下步骤进行操作:
1. 打开蜜蜂采集器软件,进入主界面;
2. 在主界面上方的工具栏中选择“新建任务”按钮,创建一个新的采集任务;
3. 在任务编辑界面中设置采集的网页地址、数据提取规则以及其他相关参数;
4. 完成设置后,点击“开始采集”按钮,蜜蜂采集器将开始根据设置的规则自动爬取网页数据;
5. 采集完成后,用户可以选择保存数据到本地或上传到云空间,方便后续处理和分析。
蜜蜂采集器2024最新版功能
极低的资源占用,优异的运行性能,可长期稳定运行
基于QT构建,原生C++编写,程序的资源占用极低,运行速度极快,从而可以支持更多的并发任务。
丰富的管理器,安全的帐号管理
软件有四种管理器:基本管理器、采集管理器、发布管理器、其他管理器。
基本管理器,主要是一些帐号相关的管理器,用于存储软件中需要使用的各种帐号信息,数据均加密存储。包括:Cookie管理、User-Agent管理、数据库连接管理、FTP连接管理、SSH连接管理、SMTP邮箱帐号、代理服务器管理、代理配置管理、外部程序管理。
采集管理器,主要是一些采集相关的管理器,用于采集工作。包括:列表页网址插件、数据处理插件、图片水印管理、中文分词设置、同义词库管理。
发布管理器,主要是一些发布相关的管理器,用于发布工作。包括:发布到站点、站点发布模块、发布到数据库、数据库发布模块、发布到文件、发布到插件、内容发布插件、发布到邮箱、文件上传配置管理、文件上传插件、消息通知配置管理、消息通知插件。
其他管理器,主要是一些杂项。包括:任务运行管理、计划任务、任务运行统计、任务运行日志文件,等等。
强大灵活的功能
数据库的连接访问,支持SSH隧道模式。
支持代理,采集更方便。
支持多帐号采集、多帐号发布。
丰富的插件类型。支持PHP、Python、Nodejs、Go四种编程语言的插件。
强大的图片水印功能。
文件下载支持断点续传。
丰富的文件上传方式。FTP、SFTP、插件方式、站点发布模块中的文件上传方式。支持上传文件到阿里云OSS、腾讯云、七牛云。FTP方式支持断点续传。
内置大量小工具。JSON分析工具、表单抓取工具,等等。
各管理器均支持导入导出。
蜜蜂采集器2024最新版推荐
数据库的连接访问,支持SSH隧道模式。
支持代理,采集更方便。
支持多帐号采集、多帐号发布。
丰富的插件类型。支持PHP、Python、Nodejs、Go四种编程语言的插件。
强大的图片水印功能。
文件下载支持断点续传。
丰富的文件上传方式。FTP、SFTP、插件方式、站点发布模块中的文件上传方式。支持上传文件到阿里云OSS、腾讯云、七牛云。FTP方式支持断点续传。
内置大量小工具。JSON分析工具、表单抓取工具,等等。
各管理器均支持导入导出。
蜜蜂采集器2024最新版内容
1. 内置运行环境:蜜蜂采集器提供内置运行环境,用户可以在软件内部直接运行和调试采集脚本,方便用户快速验证采集规则,并调整和优化采集策略,提高采集效率。
2. 支持多种文件上传方式:软件支持FTP、SFTP以及自定义插件方式的文件上传,用户可以轻松将采集到的数据文件上传到各种云空间或其他存储设备,实现数据的备份和共享。
3. 图片水印功能:蜜蜂采集器内置图片水印功能,用户可以通过设置水印样式、位置和透明度等参数,在采集的图片上添加水印,保护数据版权,增加数据的可信度。
蜜蜂采集器2024最新版更新
更新日志:
1. 优化:默认字体大小从14改为13。
2. 增加:批量访问网址的功能。
3. 增加:采集规则中的网址源之Excel文件源(xlsx文件)的支持。
4. 增加:采集规则中的内容发布之发布到Excel文件(xlsx文件)的支持。
5. 增加:站点发布配置的标签映射功能。
6. 增加:采集规则的域名替换功能。支持采集规则和历史采集数据的域名替换。
7. 增加:标签数据二次处理的字符串截取之循环截取功能。
8. 增加:标签数据二次处理的HTTP请求之多次请求并拼接输出的功能。
9. 增加:对网址采集中标签数据二次处理插件的支持。此前仅内容采集可调用插件。
10. 增加:对文件下载时“将标签内容作为文件下载地址”的多个文件下载支持。
11. 增加:文件下载时的音视频下载功能。
12. 增加:标签数据二次处理的编码转换之JSON转义和分隔符转义功能。
13. 增加:标签数据二次处理的HTML标签过滤之noscript audio video source等标签。
14. 修复:不使用独立上传时,文件上传功能无效的BUG。
15. 修复:修复POST采集时Content-Type识别错误的BUG。
16. 修复:Python插件中文乱码问题。
17. 修复:内置JavaScript脚本调用时可能崩溃的BUG。
18. 优化:其他若干功能优化与BUG修复。