构建数字图书馆的主要技术有哪些?

从计算机研究的角度来看,数字图书馆研发的一些关键技术如下。

1.数字图书馆系统结构模型;

数字图书馆是一个相当复杂的系统,需要有一个统一、规范、系统的模型作为数字图书馆研究和发展的理论指导和前提。根据建模侧重点的不同,数字图书馆模型的研究可以分为结构模型、框架模型、动态模型、过程模型和功能模型。这五种模式各有优势。如何将它们有机地结合统一起来,形成一个相对完整的数字图书馆描述,还需要大量的研究工作。

2.数字图书馆资源管理;

随着数字图书馆研究和建设的快速发展,系统资源和信息资源变得非常重要。如何更有效、更合理地管理和利用有限的系统资源(cpu线程、i/o进程、缓冲区和网络处理)和信息资源,以满足数字图书馆的各种需求,是资源管理研究的主要内容。它包括资源管理的机制和策略、管理模型和优化算法。目前,解决这一问题的方法已经提出:服务质量的概念和利用qos机制解决这一问题的方法;基于元调度方法的“bin”方案:基于数字图书馆的三层模型,采用多媒体协商、cpu调度、缓冲区分配和差错控制的方法。

3.分布式多媒体同步:

在数字图书馆的通信中,有时不仅要求实时、等时地传输多媒体数据,而且要求各种媒体对象之间保持时间和空间的同步约束。实时性、等时性和同步性是多媒体通信的基本特征,也是实现多媒体通信的关键技术和基础。同步要求各种媒体在传输后仍保持原有的时空约束。目前,国际上对多媒体同步模型的研究可以分为三类:时间轴模型、层次模型和参考点模型。对各种媒体信息的时间关系的研究也是多媒体同步的一个重要部分。目前,多媒体同步模型的研究比较深入,已经提出了很多模型,但是还没有一个完善的能够满足数字图书馆通信需求的分布式多媒体同步模型。

4.多媒体数据库:

多媒体数据库技术是一种旨在有效管理大量多媒体数据和相关信息的数据库系统。它是发展数字图书馆的关键技术之一,是多媒体、图像处理与识别、人工智能和数据库技术相结合的产物。数字图书馆中媒体资源的组织方式将不同于传统方式。其内容将是根据用户需求精选的高价值知识内容,经过分类、编辑、整理和加工,成为受教育者可以接受的形式。它是一个有序的知识库,有很大的增值,新的知识产权关系会出现。数字图书馆将资源分为元数据和对象数据。对象数据是指数字化的文本、图像、声音、图像等。,而元数据指的是那些描述和管理对象数据的数据。对象数据分布在世界各地的资源点,元数据需要集中在数字图书馆中心的超大规模服务器上。当用户查询时,中央调度系统通过元数据调度各个对象数据库的数据来提供服务。

5.基于内容的信息检索:

基于内容的检索技术是多媒体数据库的重要组成部分,也是数字图书馆研究的热点关键技术之一。基于内容的检索是指根据媒体对象的语义和上下文关系进行检索。其特征在于从媒体内容中提取信息特征。即从图像、视频、音频中分析提取特征,利用这些内容建立特征向量作为检索的索引;它是基于媒体多维特征的近似匹配,是一种信息检索技术。这项技术将支持以用户可接受的响应速度从数字图书馆的多媒体数据库中查询所需的信息。

6.数据压缩:

该技术是情报学的关键技术和基础理论问题,也是构建数字图书馆系统的关键技术。压缩编码的理论基础是信息论。从信息论的角度来说,压缩就是去除信息中的冗余,即保留不确定的信息,去除确定的信息(可推导的),也就是用更接近信息本质的描述代替原来的冗余描述。考虑到图像源的统计特性,编码方法可以分为三类:(1)。采用预测编码法、变换编码法、矢量量化编码法、子带-小波编码法和神经网络编码法。(2)考虑人的视觉特性。采用基于方向滤波的图像编码方法和图像轮廓纹理编码方法。(3)考虑到图像传输的场景特点,采用了分形编码方法和基于模型的编码方法。

7.网络:

在数字图书馆系统中,多媒体信息的访问、查询、检索和表现需要一个有服务质量保证的通信网络。Qos包括网络吞吐量、带宽、允许的延迟、抖动和错误率。设计一个全面的协议架构,一个高效的大容量宽带网络,实现一个工程上满足qos要求的通信网络,是建立数字图书馆系统的基础和关键。