定向爬虫

定向爬虫【定向爬虫】定向爬虫是网路爬虫的一种 。定向爬虫可以精準的获取目标站点信息 。
基本介绍中文名:定向爬虫
类型:网路爬虫
作用:精準的获取目标站点信息
特点:基于模版的信息提取技术
定向爬虫获取信息 , 配上手工或者自动的模版进行信息匹配 , 将信息进行格式化分析存储 。优势:基于模版的信息提取技术 , 能提供更加精準的信息 。比如价格 , 房屋面积 , 时间 , 职位 , 公司名等等 。劣势:目标网站难以大面积覆盖 , 因为基于模版匹配的信息提取技术 , 需要人工的参与配置模版 , 欲要大面积覆盖各个目标网站 , 需要大量的人力成本 , 同样维护模板也需要很大的人力成本 。