关联区域功能介绍[db:副标题]
关联区域功能,可以先截取网页中指定区域内容,然后将该区域作为数据来源再进行采集处理。 关联区域功能有利于网页结构重复或者...
cos腾讯云上传功能介绍[db:副标题]
COS上传功能为将火车采集器下载的附件、图片等文件传送到腾讯云存储空间中,便于使用腾讯云的客户进行数据的管理。 下面介绍下具体用法以及选项含义:(1) COS 配置SecretId&n...
火车采集器V9版工具功能之中文分词[db:副标题]
采集器可以通过设置的词库,来进行中文分词,就是经常说的自动提取关键词。1, 设置词库如下图:如上图 工具==》中文分词管理,来进行中文分词管理点击上图的“分词”按钮,来使用采集器内置的...
V9-起始网址数据库导入功能[db:副标题]
起始网址目前支持四种导入方式,下面介绍数据库导入功能:数据库导入支持mysql以及sqlserver两种数据库类型,在使用此功能时需要填写数据库相应的连接信息,以及所需信息所在数据库、表以及列信...
谷歌浏览器获取cookie以及抓包获取真实链接[db:副标题]
目前大多数浏览器都会自带开发者工具(一般按f12即可出现),网页的cookie以及网址打开后加载的各类信息都是可以看到的。下面以谷歌浏览器为例:1.在谷歌浏览器里打开http://www.sd-portygzc.co...
采集器在服务器无法正常登陆,提示登录异常:网络异常,状态码1-0[db:副标题]
1. 当采集器在服务器无法登陆时,如果抓包分析请求接口返回502状态码,可以尝试关闭防火墙放行918端口,浏览器请求地址 http://115.29.224.93:918/...
火车采集器V9-获取内容页网址[db:副标题]
获取当前采集页的网址,可以按下面设置, 正则提取规则为: ^(?<content>[\\s\\S]*?)$
V9-任意格式文件下载功能[db:副标题]
如下图:编辑标签界面,文件下载选项,勾选探测文件并下载,会把采集到的任何格式的文件附件下载下来,包含常见的图片。顺便说下其他选项:“将相对地址补全为绝对地址”:勾选这个,会把标签采...
人工智能-AI对话(HuoAiChat)的使用方法[db:副标题]
人工智能-AI对话功能是一个语言模型,可以模拟AI对话,进行问题解答,您可以对采集的数据通过对话的形式进行伪原创、数据提取、数字计算等等等,更多应用场景等您发掘哦~一、界面介绍(1) ...
v9-5118智能原创使用教程[db:副标题]
插件下载地址:点击下载插件在火车采集器中如何安装智能原创插件第一步,使用解压软件,提取插件安装包中的文件,解压到一个文件夹中。第二步,打开解压后的文件夹,将里面的【5118 智能原创.dl...










