网络信息资源检索与创业的探究

更新时间:2023-12-15 14:55:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

网络信息资源检索与创业的探究

1 网络信息检索存在的问题

21世纪是一个信息技术高度发展的时代,随着计算机技术、数字化存贮技术和互联网技术的快速发展,数字化信息急速增长,信息资源的“生产”、“传播”与“消费”出现了新的格局。信息资源如雨后春笋,信息在网络上的传播速度跨数量级的提升使得网络用户获取真正有用的信息越来越难,如何快捷准确地查找所需的信息资料,已经成为信息需求者急待解决的问题。笔者就网络信息检索存在的问题、网络信息的存在形式及网络信息的获取途径进行分析。

1.1 信息泛滥,查全率、查准率低

网上言论自由、出版自由在给因特网带来繁荣的同时,也导致了信息爆炸。许多非结构化信息和重复信息涌入网络,使网上信息以几何级数急剧增长,由于网络信息庞大、分散、无序等特点,使人们承受着过度的信息冲击,以至于超过了人类的信息处理与利用的能力,过量的信息使网络用户所需要的有用信息淹没在浩渺的信息海洋中,用户获取有用信息就如同大海捞针,困难重重。虽然在网络信息检索工具的索引数据库中包含了成千上万的网页,但由于数据库更新跟不上网络发展的速度,加之网络信息格式多样性等因素,致使没有一种网络信息检索工具能够为整个网络建立索引,从而使网络中大量质量高、实用性强的隐性信息难以查找。利用网络信息检索工具找到的往往是一大堆网址,检索结果的重复率相当高,用户只有逐个浏览才能从中筛选出所需的信息,信息的查全率、查准率较低。

1.2 网络信息缺乏监控,信息污染严重

网络信息的发布具有自由性、任意性,具有跨时间、跨地域、跨行业、多语种等特点,任何政府、机构、个人都可以利用网络自由发布任何信息,网络成了包罗万象、无所不有的庞杂信息源。然而这种信息发布的自由性和不可控制性的优势同时也是其致命的缺陷。信息资源网络化在给人们创造了无限信息能力的同时,也带来了巨大的信息污染,许多无用的信息,虚假信息甚至有黄色信息、色情淫秽信息、暴力信息等垃圾信息混入网络,降低信息效用,影响有效信息的利用,浪费网络用户大量的时间,还对青少年的心身健康构成危害。

1

1.3网络信息结构形式多样,缺少全功能检索工具

互联网是一个信息的海洋,从信息的存在格式看,有纯文本信息、超文本信息、文件信息、图片信息、音频信息、动画信息、视频信息;从信息存在形式看,有网页静态信息、网络交互信息、数据库信息;从信息商业形式看,有免费信息和收费信息。由于各网络信息检索工具收集信息的方式、信息覆盖面、索引编制和标引方式、检索功能和检索结果的描述和排列方式都不一样,因此,目前没有一种检索工具能够全面地检索到以上各类信息。

1.4 用户信息应用能力不均,部分用户缺乏深层检索能力

网络用户自身的素质直接影响信息检索的质量和速度,由于网络用户自身素质的原因使检索质量和速度都不尽如人意。第一,许多网络用户缺乏信息检索知识,不熟悉检索方法,通常只依赖一种搜索引擎,或用通用搜索引擎查特定类型信息,不具备深层检索的能力,所以很难找到所需的信息。第二,外语水平低,不熟悉搜索引擎界面,看不懂外文文献的标题及内容,即使碰到了有用信息也视而不见。第三,计算机应用基本技能不过关,输入文字及检索速度慢,浪费上网费用与时间。

2 网络信息检索途径分析

网络信息丰富而复杂,用户要快捷准确地找到所需信息,必须针对不同情况和不同需求采用相应的检索途径和方法。

2.1 网页信息检索常用搜索引擎法

搜索引擎是目前检索网络信息最常用的方法,一般针对网页信息。据CNNIC的调查,“用户得知新网站的主要途径”中,搜索引擎排在第一位,使用率为82.2%。而“用户经常使用的网络服务”中,搜索引擎排在第二位,使用率达到63.8%,仅次于电子邮箱的使用率[2]。搜索引擎服务已成为我国网民使用最多的服务项目之一。

2.1.1 搜索引擎定义、类型

2

搜索引擎主要指利用网络自动搜索技术软件或人工方式,对网络资源进行收集、整理与组织,并提供检索服务的一类信息服务系统。根据数据收录范围不同,可以将搜索引擎分成综合搜索引擎和垂直搜索引擎(专业搜索引擎),综合搜索引擎又可分为指南型搜索引擎和关键词检索型搜索引擎。 2.1.2 搜索引擎检索方法

搜索引擎一般提供了两种查询方式:分类目录查询和关键词查询。搜索引

擎分类目录检索方法:用户可根据要查找的信息所属的类别,在分类目录中选择某一项或某项的一子项。

2.1.3 搜索引擎的优点和局限性

搜索引擎优点:搜索引擎数据库信息来自互联网各网站,信息量十分庞大,比如世界著名搜索引擎google收录超过十五亿个网页的信息,内容包括文本、图片、视频、音频等;检索速度快捷,搜索一个关键词只用千分之几秒;可使用多关键词组合,提高检索命中率;按照关键词的接近度确定搜索结果的先后次序,优先考虑关键词较为接近的结果,减少信息筛选时间;可以实现信息缓存,延长信息的网络存贮时间,当原网页服务器暂时出现故障时用户仍可浏览该网页的内容。搜索引擎缺点:由于信息量较大,检索结果准确率低;数据库信息更新较慢;专业全文文献信息量较少;筛选有用信息比较耗时;关键词组合检索形式相对简单等。

2.2 期刊论文常用专业数据库检索

期刊论文学术水平比较高,具有权威性和严肃性,在一般的网页上出现较少,利用一般搜索引擎很难查索到,因此,很多学术机构建立了专业和综合期刊数据库,比如中文期刊的中国知网(www.cnki.net)、维普全文数据库(www.cqvip.com)、万方全文数据库(www.wangfangdata.com),外文期刊中的springer link全文数据库、美国医学索引PubMedline文摘数据库等。

2.3 图书资料常用网络数字图书馆、大学图书馆及网络书店检索

图书是最常用的文献资源,也是各类图书馆最为重要的馆藏资料,藏书量的多少是一个图书馆规模和档次的主要体现,几千年来,都是以纸质文献形式出

3

现。自从有了计算机网络,特别是互联网技术、数字存贮技术的出现和快速发展,图书资料逐渐以双重的身份出现,即纸质图书和电子图书。在互联网上如何查找图书信息呢?最常用的检索图书馆信息的方法有三种。 2.3.1 网络数字图书馆

目前最著名的就是超星电子图书馆(www.ssreader.com)和书生电子图书馆。超星电子数字图书馆开通于1999年,是全球最大的中文数字图书馆,图书馆向互联网用户提供一百多万种中文电子书免费和收费的阅读、下载、打印等服务,图书包括文学、经济、计算机、生物医学等几十大类,并且每天仍在不断地增加与更新。 2.3.2 大学图书馆

进入20世纪后,大多数大学图书馆都建立了数量不一的数字电子图书,包括商业购买的电子图书和图书馆自建的馆藏电子图书,电子图书数据库是建立在本校服务器上,本地浏览和下载都比较快,但是一般都不对外开放,只限于本校师生和特定会员使用。 2.3.3 网络书店

互联网上有很多网络书店,虽然网上书店的主要功能是销售图书,但是它的数据库或称“虚拟书架”可以作为人们查找图书信息的一个非常方便的信息源。在网上书店,可以轻松地查找到所提供的全部图书资料,可以按书名、作者、出版社、图书分类号、关键词等不同检索方法来查询,很快找到自己所需要的图书;并且通过电子支付手段,直接在网上完成购书过程。

2.4 专利、新发明等信息常用专利数据库和专利网站检索

目前,有很多的专利数据库,如中国知网的专利数据库、万方专利数据库等收录了大量的专利信息。最权威的信息还是直接登录中华人民共和国国家知识产权局的专利检索系统(http://www.sipo.gov.cn/)和中国专利网(http://www.cnpatent.com/)进行检索。

一般的专利检索系统都提供各种详细的检索项目,如中华人民共和国国家知识产权局的专利检索系统可以提供发明专利、实用新型专利、外观设计专利的

4

自由选择数据库检索,检索途径有申请( 专利 )号、专利名称、分类号、申请人(专利人)、发明人、申请日、公开日等等,数据更新也比较快,是专利检索比较常用的方法。

2.5 其它信息的检索

除了以上信息检索途径外,还有很多信息可以从别的方式进行检索,如检索地图和交通图可以用图行天下网(http:/www.go2map.com)查询,该网站除了提供全国各省地图外,还提供了300多个大中城市的交通图,地图可以根据需要放大或提供卫星拍摄地图;列车时刻可以用中国铁路(http://train.tielu.org)检索;航班可用飞友网(http://www.feeyo.com)或进入各航空公司网站查询;统计信息可进入中国知网(http://www.cnki.net)的年鉴数据库查询;网上商品信息可以进入淘宝网(http://www.taobao.com/)查询,该网站还提供网上商品交易;图片信息可以使用百度的图片查询功能检索。

3 网络信息检索与创业联想

互联网是一个信息的海洋,信息的类型各式各样,信息的分布比较分散,信息的内容真伪难以分辨。互联网给我们提供了一个方便的交流和获取信息的平台,要快捷地获取准确有用的信息,用户必须针对不同的信息,针对不同的需求采取不同的检索方法。

为解决现有的搜索引擎所存在的信息量庞大、信息过于杂乱等众多不足,应该做出更适合于人们搜索习惯的引擎,当然这样好的搜索工具需要很合理的算法、高科技人才和大量财力的支持,需要研究者不断的实践与创新。

5

本文来源:https://www.bwwdw.com/article/xrj5.html

Top