孔莹 王涛
摘要:当前,网络对传统的科技信息检索带来了巨大的挑战和冲击,如何利用这一现代化的技术手段进行快速、准确、高效的科技信息检索,是广大专业技术人员和科技情报工作者十分关心的问题。通过对网上信息资源的分析,探讨了科技信息资源检索与利用的常用方法和技巧。
关键词:网络;科技信息;检索;搜索引擎
中图分类号:G4 文献标识码:A
一、网络信息资源的特点
1.分布广、传播快、数量大、增长快
随着网络的覆盖范围不断扩大以及网络技术的发展,存在于网络上的信息资源以飞快的速度传播并迅速增长。因特网把分散在全球不同地理空间的资源都集中在一起形成了一个巨大的信息资源库,它给人们的生活、学习、工作方方面面带来了便捷,它的时效性和传播速度是传统媒介所无法比拟的。据统计,目前全球在互联网上有300万台服务器,8亿个主页,每天还要新增150个主页;每天发布14万件新的信息,全网提供的信息总量逾20TB。
2.多类型、多媒体
从形式看,有文本的文件,有计算机软件以及图像、声音等各种多媒体文件;从来源来看,政府、研究机构、大学、公司企业、各社会团体、个人等等;从内容上看,有反映政府工作的政治性文件、学术研究报告、经济活动的信息、历史文献资料、文学艺术、娱乐等。
3.不稳定
网络是开放性的,通过TCP/TP将不同的网络连接起来,对网络信息资源的组织管理并无统一的标准和规范。同时信息的地址、链接及内容本身处于经常变动之中,使得信息资源的更迭、消亡无法预测。
4.信息质量良莠不齐
网络信息分布具有很大的自由度和随意性,缺少质量控制和管理机制,使得网络信息繁杂、混乱,质量良莠不齐,安全存在隐患,给用户选择、利用网络资源带来了障碍。
二、网络信息资源的组织
1.网络信息资源的主要组织方式
1.1文件组织方式
一个文件包括数据、程序和字符,是计算机保存处理结果的基本单位。以文件方式组织网络信息资源简单方便,可以降低信息组织的难度和成本;它还能存贮各种图形、图像、图表、音频、视频等非结构化信息。
1.2数据库组织方式
数据库是在计算机存储设备上合理存放的相互关联的数据集合。数据库组织方式就是将所获得的信息资源按照固定的记录格式存储组织,用户通过关键词及其组配查询就可找到所需要的信息线索,再通过信息线索连接到相应的网络信息资源。
1.3主题树组织方式
它实际是提供一种界面机制,用户通过这个界面只与网络信息资源的主题目录进行交流,并通过主题目录间接地连接并使用多个实际数据资源。它提供了一个基于树浏览方式的简单易用的网络信息检索和利用界面,用户按照规定的分类体系逐步查询,查准率高,树型目录结构具有良好的可扩充性和严密的系统性。
1.4超媒体组织方式
超媒体技术是超文本技术与多媒体技术相结合的产物,它将文字、表格、声音、图形、图像、视频等多媒体信息以超文本方式组织起来,使人们可以通过高度链接的网络结构在各种信息库中自由航行,找到所需要的任何媒体的信息。
三、网络信息资源的检索利用
1.检索策略
1.1分类检索与主题检索相结合
传统的信息检索主要分为分类与主题两种。网络信息资源的大规模、多样化和快速增长使网络信息的检索策略应同时具备分类的族性检索特征和主题的特性检索特征。
1.2基于内容的检索
随着计算机和多媒体技术的发展,图像、图形、音频、视频信息在网络信息资源中所占比例越来越大,但对它们的检索方法却发展较慢,必须加强对多媒体信息检索的研究。目前基于内容的检索较好地解决了这个问題。
1.3.全文本、超文本检索技术
可以根据文本中任何单词或语句进行检索,还能灵活地输出全文、章节、段落。常用的方法是位置间隔和相邻检索、字符串匹配等。超文本检索是将文本、声音、图像等媒体数据的内容信息分割为若干可独立利用的节点,节点间以链路相连接,构成网状层次结构,检索由指令激活某一节点,通过链路查询所有相关信息。
2.检索工具
2.1检索工具方式分类
2.1.1自动搜寻方式
与搜索引擎的信息组织方式相对应的检索方式是自动搜寻方式。自动搜寻工具主要有自动搜寻网络资源、自动索引、自动摘要、提供检索方法和用户界面等功能。由于是自动搜寻,这种方式的不足之处是收录的信息良莠不齐,耗费大量的计算机资源,查全率高但查准率低等。
2.1.2人工分类方式
与目录指南的信息组织方式相对的检索方式是人工分类方式。利用人工或机器搜寻,但用人工分类并制作索引数据库。由于采用人工筛选和分类,这种方式的优点是信息质量高、查准率高。
2.1.3混合搜寻方式
这种方式既可以通过类目浏览查询,又可以键入一个句子、一个短语或一个姓名进行自由查询,兼有自动搜寻与人工分类两种方式的优点。网络信息检索与手工检索相比,有省时、省力,获取信息的时效性、新颖性、广泛性强的优点。
2.2常用检索工具
2.2.1Google
收录资源丰富,内容广泛,目前在全球范围内已经搜集了10亿多个网址,80多亿网页资料。其使用率已经占有全球搜索市场的50%以上。Google主要提供关键词检索,关键词检索又分为“一般检索”和“高级检索”。
2.2.2百度
百度(Baidu)是目前全球最优秀的中文信息检索与传递技术供应商。中国所有提供搜索引擎的门户网站中,超过80%以上都由百度提供搜索引擎技术支持,现有客户包括新浪、搜狐、央视国际、腾讯等。目前,百度已经和google联合,共同打造中文搜索引擎的航母。
3.网络信息资源分类组织与检索利用应具有的特征
3.1多维性
网络信息资源的分类主要用于网络信息资源的分类检索,因而它可以按照学科之间的交叉与渗透的多元关系,采用多视角、多途径揭示,充分反映学科发展的多维构架,用多元划分的方式,构建多维的分类体系。
3.2词语标记
网络信息资源的分类标记主要作用是用户检索,因而直观性、表达性是网络信息分类法的重点,而最具有表达性和直观性的标记就是词语,词语既是类名又是标记符号,用户在检索网络信息时,直接用词语来检索,标记符号(类号)基本上已没有实际意义。
第一作者为:孔莹,女,1980年12月,青岛工学院,实验师,研究方向:计算机技术。
猜你喜欢搜索引擎检索网络


