【导读】本文展示了 DB2 Content Manager 和 DB2 Content Manager OnDemand 的补充数据模型和功能性,并展示了如果通过同时使用这两个产品解决一些用例场景。
简介
在本文中,我们将描述最新版本的 IBM® DB2® Content Manager (CM) 和 IBM DB2 Content Manager OnDemand (CM OnDemand) 的优点和适用范围。首先我们描述 CM 和 CM OnDemand 的数据模型,然后针对每种数据模型展示一个例子,以便让读者明白每种模型的优点。因为这两种产品都有其核心强项,所以并不是所有的内容管理问题都能在一种产品里面得到解决。最后,我们将描述一个企业内容管理场景,其中 CM 和 CM OnDemand 可以一起工作以满足该场景的需求。
DB2 Content Manager 是 IBM 用于企业内容管理的解决方案的核心,它为管理、共享、重用和检索各种类型的数字内容提供了一个单独的、开放的和综合性的平台。这一分布式架构的中间层提供了:
- 从单个部门到地理上分散的企业的可伸缩性。
- 支持多种操作系统、数据库、应用程序和资源的开放性。
- 支持 XML 的数据模型。
- 关键任务(mission critical)应用程序与像 Siebel、PeopleSoft、DB2 Records Manager、WebSphere® MQ Workflow 以及 WebSphere Portal 这样的中间件的集成,从而提供 Web 内容管理。
IBM DB2 Content Manager OnDemand 是企业内容管理中间件的 Content Manager 解决方案的一部分。自动捕获、具有立即可用性的强大索引以及对帐单、对账单和票据的即时访问为客户服务提供了支持,并改善了操作。高级功能包括 CD-ROM 发布和 PDF 索引。电子对账单呈现功能则为提高呼叫中心工作效率和允许客户通过 Internet 进行自助服务提供了支持。
本节描述了 DB2 Content Manager 数据模型,指出了它的一些优势和局限性。
图 1显示了 DB2 CM 所使用的数据模型。
DB2 CM 数据模型是一种面向对象的关系数据模型。一个 Item 类型由多个条目组成,这些条目都有被指定的相关的属性。Item 类型是数据模型的主要组件,它包含了所有的子组件(如果有的话),以及相关的数据。一个 Item 类型有:
- 一个根组件 - 分级 item 类型的第一级,或者仅有的一级。
- 0 个或者多个子组件 - 分级 item 类型的第二级,或者更低级,这是可选的。
- 类别 - 有两种系统定义的 item 类型:
- 非资源 item 类型 - 表示没有存储在资源管理器上的实体。被划分为 item 类的条目被当作元数据存储在库服务器(library server)上。
- 资源 item 类型 - 表示存储在资源管理器中的对象。这些条目都是描述和指向资源管理器上的内容,例如视频、图像、文件和其他数据。
动态数据对象(DDO)表示在数据体系结构中的组件(根组件、子组件和资源组件)。持久数据标识符可以惟一地标识这些对象,这些对象以数据条目作为其属性值,并且包含了内容。每个数据条目都有一个数据标识符,一个名称,一个值和一些属性(例如可以为空,数据类型,等等)。链接,或者引用,是由数据条目表示的,每个数据条目引用另一个条目类型中的另一个条目(资源或非资源)。链接将两个条目关联起来,并提供了访问被链接条目的途径。链接关系有一个名称,一个标识符,例如 "contains" 或者 "has"。只有条目的根组件才可以链接到其他条目或者被其他条目链接。"Outbound(出站)" 链接是指以该条目作为源的链接。"Inbound(入站)" 链接是指以该条目作为目标的链接。
DB2 Content Manager 的一些主要优势包括:
- 集成了文本搜索的查询语言- 用于查询 CM 数据模型的所有细节。因为系统表的复杂性是完全透明的,所以这种查询语言非常易于使用。缓存的数据模型定义能够允许系统高效地执行查询。这种查询语言中还集成了基于 DB2 Net Search Extender 的文本搜索,因此它支持全文搜索,组合的文本搜索以及基于索引的搜索。任意长度的属性,例如一个文档的摘要,都可使用这种查询语言进行检索,而且还可以进一步对这些属性进行搜索以便找到文本中的任意单词或者单词组合,这可以通过对文本类型的元数据或者文本内容进行全文搜索来做到。如果条目类型被定义为全文索引,那么装载到这种条目中的文本文档将自动地被建立全文索引。而且,如果一个文档是通过 ODMA 接口存储的,那么 DB2 CM 将自动地建立一个全文索引。这种查询语言还遵从 XQuery 路径表达式(XQPE)规范。
- 联邦搜索- DB2 Information Integrator for Content 提供了对跨多个离散的数据源信息的联邦搜索和更新,这些信息可以是结构化的,也可以是非结构化的。任何类型的不同目标数据源都可以以任何组合轻松地进行配置。还可以添加和搜索新的数据源。不管数据源是什么格式,从一个联邦搜索得到的结果都是一种固定的数据格式(从技术上讲叫做动态数据对象)。
- 对视频资产的支持- 视频流资产 API 提供了对检索归档的和流化的视频的支持。由于视频流对象的内容一般比较大,像添加、检索和更新这样的持久操作通常是通过 IBM VideoCharger Server 或者第三方的视频服务器来完成,这种第三方的视频服务器使用的是像文件传输协议(FTP)这样的标准协议。根据相关的元数据,可以搜索视频资产,并建立会话以便将内容从视频服务器通过流直接送到视频播放器。该 API 还能支持 Multi-Segment 播放列表。
- 工作流- Document routing 提供了沿预定义的流程路由工作的集成能力。流程定义了用户执行工作的方式以及工作前进时所依的路线。不同的路由方式包括:
- 连续的- 连续的步骤流。
- 分支的- 根据用户行为有条件地路由。
- 临时路由- 工作不是按照预定义的方式执行的。
为了提高效率,分析随时间变化的工作负荷,或者为了查看某一特定条目的整个历史,可以对工作流进行监视。
- 与遗留系统和垂直工业应用程序的集成 - DB2 CM 提供了一套开放的、发布的、一致的面向对象 API,以便于应用程序集成。这使得连接和支持像客户关系管理(Customer Relationship Management)、企业资源计划(Enterprise Resource Planning)、Web 应用程序以及遗留系统应用程序这样的应用程序成为可能。
通常,DB2 Content Manager 本身并不提供对以下特性的支持:
- 来自大型机的流数据。
- 内容的批量装载。CM 并不提供将内容装载到系统中的实用程序。您可以手动地从 CM 客户端获取文档或文件,也可以编写一个实用程序来成批地装载文档。
- Microsoft® SQL Server。 CM 的确支持使用 IBM DB2® Universal Database™ 和 Oracle 作为它的内容仓库。不过,SQL Server 在这种环境下并不受支持。
本节将描述 DB2 Content Manager 数据模型, 并指出这种数据模型的优势及其局限性。
图2显示了 DB2 CM OnDemand 所使用的数据模型。
DB2 CM OnDemand Server 环境包含一个库服务器和一个或多个对象服务器,对象服务器驻留在一个或多个节点中。库服务器维护着关于存储在 DB2 CM OnDemand 中的报告的一个中央数据库。对象服务器维护着缓存中的文档,或者利用归档存储管理器维护归档媒介(例如光媒介或磁带)上的文档。对象服务器负责装载数据、检索文档和输出数据。
术语 application、application group和 folder 表示 CM OnDemand 存储、管理、检索、查看和索引数据的方式。
- folder(文件夹)是用户查询和检索存储在 CM OnDemand 中的数据(报告)时所针对的惟一目标。如果这些应用程序组具有相同的数据库字段的话,一个文件夹可以查询不止一个的应用程序组。
- application group(应用程序组)是定义数据库、存储需求和报告的地方。如果这些应用程序具有相同的数据库和存储管理属性的话,一个应用程序组可以包含不止一个的应用程序。每个应用程序代表用于定义系统的一个报告。
- application(应用程序)描述一份报告的物理特征。您必需将应用程序指派给某个应用程序组。