熊猫智能视窗(chuāng)采集软件(jiàn)是(shì)新一代采集软件(jiàn),全程可视(shì)化视窗鼠标操作,用户无需(xū)关(guān)心网页源码,无需编写采集(jí)规则,无需使(shǐ)用正则(zé)表(biǎo)达式技术,全(quán)程(chéng)智能化辅助,是采集软件行业的换代产品,通用性(xìng)采集软(ruǎn)件,可以应(yīng)用(yòng)在各个行业,满足各种采集需求。是复(fù)杂采集需求的必选,也是采集软件使(shǐ)用新手(shǒu)的首(shǒu)先。
熊猫采集软(ruǎn)件的设计目标之一,是作为通用的垂直搜索引擎,配合熊猫的分词索引检索引擎,用户可(kě)以轻松构建自己的行业垂直搜索引擎,如招(zhāo)聘人才、房(fáng)产、购物、医疗健康、二手、分类信息(xī)、商(shāng)务、交友、论坛、博客、新闻(wén)、经(jīng)验、知识(shí)、软件等等,在此过程中,用户并(bìng)不需要非常专业(yè)的技术基础(chǔ)即可构建自己的行业垂直搜(sōu)索(suǒ)引擎。
熊猫采集的(de)功能(néng)强大且全(quán)面,是复杂采集需求的必选。除老式采集(jí)工(gōng)具软件所具有的功能(néng)外,特有功能包括:
面向对象(xiàng)采集。一(yī)个采集对象的子项(xiàng)内容可以(yǐ)是分散在若干(gàn)个不(bú)同页(yè)面(miàn)内,页(yè)面间可以(yǐ)是(shì)需要(yào)通过多次链接才能到(dào)达(dá),数据彼此间(jiān)可以具有复杂(zá)逻(luó)辑(jí)关(guān)系。
复杂结构对象的采集。支持使用多个数据库库表来(lái)联合存储采集结果。
正文与回(huí)复一并(bìng)采集,新闻与(yǔ)评论(lùn)一并采集,企业资料和企业多产品系列一并采集,等。采集的结果使用多张(zhāng)表(biǎo)联合(hé)存储,采集后的数(shù)据(jù)可(kě)以直接作为网站后台(tái)数据库使用(yòng)。
分页内容自(zì)动智能合并(bìng)。熊猫系统具有(yǒu)强大的(de)自动(dòng)分析判断能力,智能的完成(chéng)各(gè)种(zhǒng)情况下的(de)分页(yè)内容的自动合并操作,无需(xū)用(yòng)户过多干预。
每个被采集的页(yè)面(miàn)都可以定义多个模板。系统会自动(dòng)使用最匹配的模板,在传统采集工具(jù)中,由于无法有效解(jiě)决多模板问题,使得采集(jí)结果很难(nán)完整。
仿浏览器(qì)动态(tài)Cookie对话。很(hěn)多场合下(xià),网站使用cookie的(de)对话功能,实现(xiàn)对敏感数(shù)据的(de)加密(mì)操作,避免数据被批量下载,此时就需要使用(yòng)熊猫采集(jí)软件的动态Cookie对(duì)话功能。
图文混排对象的合(hé)并采集。对于文字(zì)内容中夹杂的非文字内容(如图片、动画、视(shì)频、音乐、文件等),熊猫(māo)也会进行智能化处理,自动下载(zǎi)该非文字对象到本地或指定的远(yuǎn)程(chéng)服务器,并对结果进(jìn)行妥善处理,使得(dé)采集结果(guǒ)的图文(wén)混排(pái)对象(xiàng)中,可以保(bǎo)留被(bèi)采集前的原样,以便用户能直接使用采集结果。
精炼的采集结果。熊(xióng)猫(māo)采集软件(jiàn)使用仿浏览器解析技术(shù),采集结(jié)果是从网页(yè)可视化(huà)内容中进行(háng)匹配,而不会在(zài)网页源(yuán)码中使(shǐ)用正(zhèng)则表达式技术进行泛(fàn)匹配,因此采集结果非常精炼(liàn),不会夹杂任何(hé)无关网(wǎng)页源(yuán)码内容。
全程智能(néng)辅助操作。软(ruǎn)件尽可能的自动(dòng)为用户实现自(zì)动(dòng)设置操作,仅将一些必要操(cāo)作留给用户(hù)。同时帮助内(nèi)容随着用户(hù)的操作而动态显示。
模拟(nǐ)登录、伪原创(chuàng)、自动运行、多数据库引擎支(zhī)持、自动发布、FTP同步上传、网页编码自(zì)动(dòng)识别(bié)、图片与文(wén)件的下载、对采(cǎi)集(jí)结(jié)果进行过滤挑选、多线(xiàn)程(chéng)、多(duō)任务等(děng)等(děng)软件(jiàn),同时推出全功能(néng)免费版(bǎn),仅限制采(cǎi)集(jí)许可(kě)总量,但用户(hù)可以通过各种途径(如反(fǎn)馈(kuì)使用(yòng)意见、友情链接、协助软件(jiàn)推广等)轻松扩(kuò)大许可总(zǒng)量,积极参与的用户可以轻易获得无上限的(de)许可(kě)总量。
