连结地址


连结地址

文章插图
连结地址【连结地址】连结地址包括不同格式、不同属性、不同位置的各项网路资源的网页地址和本地资源的跳转地址 。资源(resource)的种类有许多,它可以是一篇电子文档、一张图片、一段多媒体音频视频,甚至是一项网路服务(例如气象服务或者会融服务) 。
基本介绍中文名:连结地址
外文名:chained address
定义:网路资源的网页地址
类型:网页,窗体,文档,图形等
相关名词:网路爬虫,连结
套用学科:网路和接口
定义超文本标记语言的一大特徵就是利用URI地址,将不同格式、不同属性、不同位置的各项网路资源,用一种统一的方式相互连结起来 。担负这种连结任务的,就是URI,即统一资源标识(Uniform Resource Identifiers,URI)有许多种类型 。统一(uniform)的规则提供了多种优点:它允许网路上不同类型的资源标识,利用同一种方式表达出来;它採用统一的语法格式,使得在网路上不同位置的资源也能利用同一种方法表达 。连结地址是不同格式、不同属性、不同位置的各项网路资源的网页地址 。资源(resource)的种类有许多,它可以是一篇电子文档、一张图片、一段多媒体音频视频,甚至是一项网路服务(例如气象服务或者会融服务) 。在表中使用连结栏位时,可以从数据表或窗体中转入各种信息 。只要单击栏位中显示连结地址,即可进入另一个对象或程式中 。连结地址可以指向的数据类型有以下3种:①Intemet上的Web页 。②Access 2003中的窗体和报表等对象 。③字处理文档、电子报表或图形 。保存连结地址时可以为每一个记录都保存一个单独的连结地址,以有利于及时地转到相应的信息中 。当在一个表中所有的记录都指向同一个超连结地址时,无需在表中设立连结栏位,就可以将这个连结地址的内容保存到数据表或者窗体中 。相关名词网路爬虫网路爬虫是通过网页的连结地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其他连结地址,然后通过这些连结地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完毕 。如果把整个网际网路当成一个网站,那幺网路爬虫就可以用这个原理把网际网路上所有的网页都抓取下来 。这样看来,网路爬虫就是一个自动提取网页的程式,它为搜寻引擎从网际网路上下载网页,是搜寻引擎的重要组成 。在抓取网页的时候,网路爬虫一般有两种策略:广度优先和深度优先 。广度优先是指网路爬虫会先抓取起始网页中连结的所有网页,然后再选择其中的一个连结网页,继续抓取在此网页中连结的所有网页 。这是最常用的方式,因为这个方法可以让网路爬虫并行处理,提高其抓取速度 。深度优先是指网路爬虫会从起始页开始,一个连结一个连结跟蹤下去,处理完这条线路之后再转入下一个起始页,继续跟蹤连结 。这个方法有个优点是网路爬虫在设计的时候比较容易 。由于不可能抓取所有的网页,有些网路爬虫对一些不太重要的网站,设定了访问的层数 。这也让有些网站上一部分网页能够在搜寻引擎上搜寻到,另外一部分不能被搜寻到 。连结连结是超文本连结的简称,是World Wide Web的关键概念 。连结是指从一个网页指向一个目标的连线关係,这个目标可以是另一个网页,也可以是相同网页上的不同位置,还可以是一个图片、电子邮件地址、档案,甚至可以是一个应用程式 。连结也称超级连结,当浏览者单击已经连结的文字或图片后,连结目标将显示在浏览器上,并且根据目标的类型来打开或运行 。按照连结路径的不同,网页中超连结一般分为以下3种类型:内部连结,锚点连结和外部连结 。如果按照使用对象的不同,网页中的连结又可以分为:文本超连结,图像超连结,E-mail连结,锚点连结,多媒体档案连结,空连结等 。