本章节聚焦于"查找汉语字、词-信息检索与利用2-信息检索实践"中的具体实践方法,特别是针对文本信息、多媒体信息以及超媒体超文本检索的探讨。在手工检索方面,提到的主要工具包括常用的字典如《辞海》、《新华字典》和《现代汉语词典》,以及适合查找冷僻字的《康熙字典》和《中华大字典》,以及研究汉字古义和古形的《说文解字》和《古汉语常用字字典》。电子字典和辞典的选择转向了在线资源,如在线词典<http://www.ourdict.cn/>,提供了便捷的网络查询途径。
在电子时代的检索实践中,文本信息检索是最基础的部分,涉及文本数据的处理和检索技术,例如搜索引擎的使用。教材P14至P49详细介绍了搜索引擎的功能和操作,包括搜索引擎的概念,其组成部分(搜索器、索引器、检索器和用户接口),以及工作原理。搜索引擎通过在互联网上搜集、理解和组织信息,然后根据用户的查询条件提供检索服务。例如,用户可以通过输入URL、网络目录浏览或关键词检索来进行信息查找。
搜索引擎又细分为主题搜索引擎和按类型分类的搜索引擎,如Google和百度,章节中还介绍了这些搜索引擎的高级检索技巧和常见检索功能。此外,教学内容还涵盖了如何利用各种资源,如通过WWW、FTP、Telnet、Gopher和WAIS等协议访问信息资源,以及在因特网上进行高效的信息检索策略。
对于文本信息检索,教材特别强调了网页信息的抓取、预处理(如提取正文信息、分词和构建关键字索引)、链接分析和权重计算,这些都是影响搜索结果相关性和排序的关键步骤。通过理解并掌握这些技术,学生可以更有效地在浩瀚的网络信息中找到所需的信息。
这部分内容深入浅出地讲解了在信息技术背景下,如何通过不同的工具和技术手段进行汉语字词查找,无论是传统的纸质字典还是现代的网络搜索引擎,都是提升信息获取效率的重要途径。通过学习和实践,读者可以提高信息检索的技能,适应信息化社会的需求。