多媒体数据库系统存储和管理大量多媒体数据,例如音频、视频、图像、图形、语音、文本、文档和超文本数据,其中包含文本、文本标记和链接。由于音频-视频设备、数码相机、CD-ROM 和 Internet 的普遍使用,多媒体数据库系统越来越普遍。多媒体数据库系统包括NASA的EOS(地球观测系统)、各种图像和音频视频数据库、互联网数据库等。
有两组主要的多媒体索引和检索系统,如下所示 -
基于描述的检索系统- 用于根据图像描述(例如关键字、标题、大小和创建时间)构建索引和执行对象检索。如果手动执行,基于描述的检索是劳动密集型的。如果自动化,则结果通常质量较差。
例如,为图像分配关键字可能是一项困难且随意的服务。基于 Web 的图像聚类和分类技术的最新发展提高了基于定义的 Web 图像检索的质量,因为图像包围文本信息和 Web 链接信息可用于提取适当的描述并将描述相似主题的图像分组在一起。
基于内容的检索系统- 它可以支持基于图像内容的检索,例如颜色直方图、纹理、图案、图像拓扑以及对象的形状及其在图像中的布局和位置。基于内容的检索有助于索引图像的视觉特征,并改进基于特征相似性的对象检索,这在一些应用中是非常理想的。
在基于内容的图像检索系统中,通常有两种查询 - 基于图像样本的查询和图像特征规范查询。基于图像样本的查询查找与给定图像样本相似的所有图像。该搜索使用已在图像数据库中提取和排序的图像的特征向量来分析从样本中提取的特征向量(或签名)。
图像特征规范查询定义或绘制颜色、纹理或形状等图片特征,将其翻译成特征向量与数据库中图像的特征向量连接。
基于内容的检索具有广泛的应用,包括医疗诊断、天气预报、电视制作、图像网络搜索引擎和电子商务。包括 QBIC(按图像内容查询)在内的一些系统提供基于样本和图像特征需求的查询。还有一些系统支持基于内容和基于描述的检索。