文件NoSQL与ECM

时间:2020-02-23 14:41:08  来源:igfitidea点击:

企业内容管理(ECM)系统已经存在十多年。
Document NoSQL可以提供一些竞争。
ECM的示例包括IBM FileNet,DB2 Content Manager和EMC Documentum。
许多小型(如Stellent(现在Oracle)已被纳入更大的产品。

简化的ECM系统,称为基本内容服务,也出现 - 最常见于Microsoft SharePoint。
SharePoint的出现商品化了ECM市场,干燥创新,尽管为客户提供较低的牌照费用。

ECM Systems支持文档版本 - 通常是一个主要发布版本和次要的正在进行的版本,但有些也支持第三个"修订版"号。
这些系统支持存储与其元数据分开的文档并强制访问对这些文档和属性的访问,以进行读写访问。

工作流支持也被纳入大多数突出的ECM系统。
这些从基本工作流程 - 批准和更新文件 - 到全新的终端业务流程管理,包括流程仿真和往返再造,以进行连续流程改进。

记录管理系统(RMS)通常基于ECM系统的顶部构建,从而允许将保留规则应用于文档并进一步保护它们免受修改。
例如,如果我们在受监管行业,并且需要在诉讼或者发现期间保留重要文件,这是特别有用的。

这些ECM系统通常存储在文件系统中的文档和关系数据库管理系统中的元数据。
ECM系统有效地是可以群集高可用性的中间件应用程序,但依赖于集中式数据库和文件共享。
它们的可扩展性有限,非常高速摄取,比较少和更大的重要文件更加对齐,例如办公文件和文档扫描的高质量TIFF图像。

文档NoSQL数据库一直在添加新函数。
它们的高可扩展性和在非常便宜的商品服务器上运行的能力意味着它们的成本甚至比商品化ECM系统更低。

一些NoSQL数据库支持存储多个版本。
大多数这些数据库是目前最大的克隆,但有些文档数据库确实支持这一点。
MarkLogic Server有一个文档库服务(DLS)添加版,支持文档的版本化存储,尽管在MarkLogic的REST API中不可见。

MarkLogic Server还包括内容处理框架(CPF)。
CPF是一个状态引擎,它通过生命周期移动单个文档,并根据内容执行操作,通常,将二进制文档转换为XHTML并使用第三方工具执行实体提取。

这些小函数集可以在未来的多个NoSQL供应商中采用和扩展,以便提供Microsoft SharePoint和ECM系统提供的相同的发动机级函数。
如果是这样,文件NoSQL数据库可能成为ECM后面的新存储和元数据引擎,这意味着增加吞吐量并降低客户的成本。
它还承诺从ECM系统本身中的这些数据库中嵌入搜索。
与当前单独的ECM系统相比,这将提供增强的函数。