元数据白皮书
更新时间:2024-05-07 12:20:01 阅读量: 综合文库 文档下载
- 元数据白皮书推荐度:
- 相关推荐
元数据管理白皮书
1. 什么是元数据............................................................................................................ 3 2. 为什么需要一个元数据知识库 ................................................................................... 3
2.1. 对IT用户的价值 ............................................................................................ 4 2.2. 对商业用户的价值 .......................................................................................... 4 3. Teradata Meta Data Services 2.1 ............................................................................... 4
3.1. 环境 ............................................................................................................... 4 3.2. MDS管理元数据知识库的工具 ....................................................................... 5
3.3. 3.4. 3.5. 3.6. 3.7. 3.8. 3.9. 3.10.
应用信息模型(Application Information Models) .......................................... 5 安全 ............................................................................................................... 6 Teradata数据库信息模型(DIM) ................................................................... 7 Teradata数据字典扫描程序 ............................................................................. 8 DIM自动更新 ................................................................................................ 8 审计跟踪 ........................................................................................................ 8 业务元数据..................................................................................................... 9 ETL元数据 ................................................................................................. 9
3.11. MetaSurf? ................................................................................................ 10 4. 定制和扩展元数据知识库 .........................................................................................11
4.1. 4.2. 4.3. 4.4.
MetaDesigner ...............................................................................................11 C++编程接口 ................................................................................................ 12 COM编程接口 ............................................................................................. 12 XML接口 .................................................................................................... 12
5. 元数据互换 ............................................................................................................. 12
5.1. 元数据集成技术................................................................ 错误!未定义书签。 5.2. 元数据标准................................................................................................... 12 6. 本地化和国际化 ...................................................................................................... 13
1. 什么是元数据
所谓元数据,是指关于数据的数据,可以用来描述数据的类型、来源、定义、存储位置、商业规则,使得业务人员可以正确地使用数据仓库,技术人员可以使用元数据信息开发数据仓库应用、维护数据仓库的运行。
基于上面的定义我们可以知道元数据的使用者可以分为:技术用户、商业用户两类,因此元数据也可以相应的分为业务元数据(Business Metadata)、技术元数据(Technical Metadata)两类,下面分别针对这两类信息说明:
? 技术元数据(Technical Metadata)
技术元数据主要被企业IT人员(系统分析员、数据仓库管理员、数据库管理员)使用。技术元数据为企业数据仓库提供了详细的蓝图,企业IT人员可以借助这一蓝图更方便的扩展和维护数据仓库。技术元数据可以跟踪数据的流动,确定元数据来自哪里?什麽时间被加载?目标数据库是什麽?数据从源到目标移动过程中应用于该数据的技术和业务规则是什麽?通过跟踪、分析源数据加载到目标系统的过程,企业IT人员可以使用技术元数据检查数据仓库信息的准确性。此外利用已经定义的技术元数据信息企业IT人员可以分析任何涉及改变对数据仓库的影响,这样可以更快速的实施改变和后续项目。
? 商业元数据(Business Metadata)
商业元数据主要被企业业务人员使用,以他们可以理解的、简单易懂的语言描述数据仓库的对象,使他们能够不借助企业IT人员就可以找到自己需要的信息。
2. 为什么需要一个元数据知识库
很多人已经有了关于数据仓库的元数据,这些元数据可能是文档、电子表格、书面说明或是头脑中的想法。存储、定位和维护这些信息可能是很麻烦的。一个数据仓库的元数据知识库提供了一个中央存储位置,是用户可以在线访问信
息。知识库中存储了数据仓库整个处理过程中涉及到的信息,这些信息包括:数据仓库的加载,数据仓库中数据的结构,数据仓库中数据的的使用。
2.1. 对IT用户的价值
数据仓库的元数据知识库允许IT人员更有效的管理数据仓库。IT人员可以使用元数据完成下列工作:
? 消除数据冗余
? 在对数据仓库做改变之前确定改变的影响
? 确定数据使用情况,了解花费时间修改、花费空间存储的数据是否有人
使用
? 理解数据仓库的结构和关系
2.2. 对商业用户的价值
数据仓库的元数据知识库对商业用户也有很高价值。例如:商业用户可以 ? 搜索知识库查找特定的信息在数据仓库中的位置 ? 理解数据仓库中数据的含义
? 取得关于数据的进一步信息,如:数据如何被刷新?什么人拥有数据?
数据何时被修改?数据来自哪里?
? 理解数据的商业规则,如:数据的最大、最小值是什么?编码的含义? ? 理解数据所属的业务主题是什么
3. Teradata Meta Data Services 2.1
3.1. 环境
MDS将元数据存储在Teradata数据库的一组表中。MDS软件运行在Windows(Win98/ME/NT/2000)或MP-RAS Unix系统,借助Teradata ODBC Driver访问Teradata数据库。
MDS2.1支持Teradata数据库V2R4.0.X和V2R4.1.X。
3.2. MDS管理元数据知识库的工具
MDS2.1提供了两个工具管理存储元数据德Teradata表:metacreate、metamigrate。这些工具支持Windows和Unix MP-RAS平台。
Metacreate工具在一个已定义的数据库中初始化元数据知识库,建立MDS需要的表。在初始的元数据知识库被建立以前不能进行任何MDS操作。
MDS 2.1提供了一个工具metamigrate转化低版本的MDS知识库到MDS2.1格式。这个工具自动修改所有已存在的数据(模式、对象等)以符合MDS 2.1格式。
3.3. 应用信息模型(AIM)
应用信息模型(AIM)定义了一组元数据在MDS知识库中如何存储。一个事例模型表示如下:
DatabaseHasViewsHasTablesClassDescriptionRelationshipDescriptionsClassDescriptions AIM有三类对象构成:
? 类描述(Class Descriptions)— 定义了元数据的类型。在上面的例
子里数据库、视图和表都是类描述。在知识库中类描述的实体被称为对象。 ? 属性描述(Property Descriptions)— 和类描述相关的数据域如:类
型、名称。 ? 关系描述(Relationship Descriptions)— 描述两个类之间的关系。
在上面的例子里关系描述被定义为“DatabaseHasTables”,关系在数据库对象和标对象之间建立了联系。
3.4. 安全
MDS 2.1提供了丰富的安全管理功能,可以控制不同的用户、组读、写、增加元数据对象。这些安全设定可以由MetaManager或MDS编程接口实现。
3.5. Teradata数据库信息模型(DIM)
Teradata数据库信息模型(DIM)是特定的元数据信息模型,MDS用它来存储Teradata数据库结构和内容的信息。MDS 2.1中Teradata物理元数据可以包含触发器和存储过程信息。
MDS 2.1对物理元数据提供了扩展,使得它可以存储与Teradata物理信息相关的商业信息。
Database Information ModelSubjectAreaDatabaseSystemDatabaseHasSubjectAreasSystemHasDatabasesSystemHasNodesSubjectAreaEntitiesBusinessEntityDatabaseHasEntitiesDatabaseHasRulesNodeDataBaseBusinessRuleBusEntityHasAttributesDatabaseHasViewsDatabaseOwnsDatabasesDatabaseHasTriggersBusRuleValuesBusAttrRulesBusEntityViewDatabaseHasTablesTableHasTriggersBusEntityTableColumnHasTriggersTriggerValidValuesBusinessAttributeBusAttrColumnTableDatabaseHasStoredProceduresSPReferencesTablesViewTableHasColumnsSPReferencesViewsStoredProcedureViewHasTableColumnsColumnBusAttrViewColumnViewHasColumnsSPReferencesStoredProceduresViewColumnTableHasRefConstraintsSPHasParametersSPParameterReferenceTableHasCheckConstraintsConstraintReferencesColumnsCheckReferenceColumnTableHasIndicesIndexIndexContainsColumns= New in MDS 2.1IndexColumn
3.6. Teradata数据字典扫描程序
MDS提供了一个Teradata数据字典扫描程序Metaload 以便加载Teradata系统物理元数据到知识库中。多个Teradata系统可以加载到一个单一的知识库中,知识库不必与提供元数据的Teradata在一个系统。Metaload使用Teradata ODBC Driver访问Teradata系统。
Metaload 分析数据字典的数据定义语句,建立不同对象的关系。MDS分析视图定义语句存储视图引用的表列信息;MDS分析存储过程的定义语句存储存储过程对视图、表、其它存储过程的引用;MDS分析触发器的定义语句存储触发器与表列的关系。
3.7. DIM自动更新
由于Teradata数据库物理元数据市MDS知识库的重要组成部分,因此保持最新信息动态反映Teradata系统的改变是至关重要的。MDS使用自动的DIM更新特性保持MDS知识库与Teradata系统的一致性。假如多个Teradata系统被存储在单一的知识库中,每一个Teradata系统均可被更新。
MDS提供了一个数据库服务器端的进程(Relay Services Gateway – RSG),借助RSG数据库引擎转发每一个数据定义语句到MDS,MDS分析SQL抽取出元数据改变的部分更新知识库。
在MDS 2.1中RSG运行在Windows和MP-RAS两个平台(Windows平台要求Teradata为V2R4),RSG通过TCP/IP与MDS组件DDL Gateway(运行在Windows和MP-RAS两个平台)通讯,DDL Gateway负责管理RSG和Teradata的处理信息,并调用Integrity Server修改MDS知识库。
3.8. 审计跟踪
MDS提供了维护Teradata数据定义语句改变的审计跟踪功能。审计日志存储在MDS知识库中,可以通过MetaManager浏览。
3.9. 商业元数据
MDS 2.1提供了Excel Import Utility 从Excel电子表格中加载商业元数据到商业信息类。
此外,来自数据模型工具(如:ERWin)的商业信息也可以借助Meta Integration Model Bridge (MIMB,Meta Integration Technology公司产品)加入知识库。
3.10. ETL元数据
除了物理和商业信息外,MDS还可以存储和维护ETL工具和ETL工具对物理元数据操作的信息,例如:表最后被加载的时间?什么工具用于加载此表?
客户加载模型(Client Load Model)被用来存储此类信息,这个模型将维护从加载脚本抽取出的元数据与Teradata数据库信息模型中表、列等对象的关系,如:此脚本对那个表操作。
MDS工具Metaclient 将扫描Mulitload、Fastload和Tpump脚本和输出文件,抽取信息加入知识库,同时建立脚本与Teradata数据库信息模型中表、列等对象的关系。这个工具运行在Windows和MP-RAS Unix上。
Client Load ModelScriptScriptHasSourcesScriptHasTargetsSourceSourceTypeINMODRoutineStartRecordRangeEndRecordRangeRecordFormatIndicatorBitsVersionIDScriptQualifierOutputFileNameLoadUtilitySessCharSetScriptLevelDDLUsedProcessorTimeHighestReturnCodeCompletionStatusStartTimeStartDateEndTimeEndDateTargetTargetTypeTargetSystemNameTargetDatabaseNameTargetLevelDDLUsedTargetLevelDMLUsedNbrRecordsReadNbrRecsSentToTDNbrRecordsDeletedNbrRecordsInsertedNbrRecordsSkippedNbrRecordsUpdatedNbrErrorsTbl1NbrErrorsTbl2ScriptLoadsDIMViewsScriptLoadsDIMTablesSourceUpdatesDIMTablesTableSourceUpdatesDIMViewsViewDatabaseInformation ModelSourceHasSourceFieldsSourceFieldSourceFieldUpdatesDIMColumnsColumnDataTypeDataLengthRecLayoutNameViewColumnSourceFieldUpdatesDIMViewColumns
3.11. MetaSurf?
MetaSurf?提供了一个标准的、易于使用的Web界面,IT或商业用户可以通过此界面搜索、向下挖掘元数据知识库中的信息。MDS 2.1 MetaSurf?有下列功能:
? 搜索结果可分多页显示
? 提供了使用布尔逻辑进行高级搜索的能力 ? 提供了关键字检索的能力 ? 在线编辑描述信息
MetaSurf?使用Active Server Pages 和 VB Scripting建立,这些脚本借助MDS COM接口访问MDS知识库。
4. 定制和扩展元数据知识库
MDS不仅提供了元数据模型管理Teradata物理和商业信息,而且还提供了一个框架使得最终用户可以定制和扩展元数据信息。
4.1. MetaDesigner
MetaDesigner 是一个Windows应用程序,它提供了易于使用的图形化界面。
用户可以通过MetaDesigner 在MDS知识库中定义新的类、关系和属性。
4.2. C++编程接口
MDS提供的面向对象的编程接口,允许创建模型,定义类、类之间的关系,同时他也提供了编程接口增加、修改和删除元数据。C++编程接口在Windows和Unix MP-RAS两个平台有效。
4.3. COM编程接口
除了C++编程接口,MDS还提供了COM编程接口,MDS COM是一个脚本化的OLE自动化对象编程接口,接口允许其他应用程序或编程工具访问MDS知识库中的元数据。借助OLE自动化接口,一些应用程序,如:Office可以使用VB访问和浏览MDS知识库。COM编程接口只在Windows平台有效。
4.4. XML接口
C++和COM均为编程接口,为了易于使用,消除编程要求,MDS提供了XML工具
MetaXML。MetaXML将读取XML格式的ASCII文件,分析内容,调用MDS C++接口执行相关操作。MetaXML除了可以加载元数据进入MDS知识库外还可以建立新的类、关系、属性。MetaXML只在Windows平台有效。
5. 元数据互换
5.1. Meta Integration Technology
Meta Integration Technology提供了在不同工具之间移动元数据的功能,它可以实现MDS和其它工具的元数据交换。
5.2. 元数据标准
目前有两个标准化组织制定元数据的标准(the Object Management Group – OMG and
the Metadata Coalition – MDC),NCR是OMG的成员。
6. 本地化和国际化
MDS是国际化的软件,它提供了Kanji SHIFT-JIS、Kanji EUC和8位字符集的支持。资源文件和对话框支持日文显示,MDS可以被本地化为其它语言。
正在阅读:
元数据白皮书05-07
全国计算机二级access选择题1612-27
北师大版一年级数学上册《捆小棒》教学反思03-07
培训游戏大全-HR猫猫04-14
突出“五个基本” 推进党的基层组织建设01-30
公司会计政策选择的盈余管理研究05-24
宜昌市“三校联合体”2008-2009学年度第一学期高一年级期末联考04-20
2008年普通高等学校招生全国统一考试数学卷(福建.理)含详解05-30
机械工程测试技术基础第三版课后习题答案05-02
- 企业安全培训试题题库
- 《WEB应用开发》复习题
- 2018届河南省新乡市高三第三次模拟测试英语试题Word版含答案
- 山东省建设工程优质结构评审标准(试行)
- 2016-2022年中国MEMS行业分析及发展趋势预测报告 - 图文
- 工程材料习题和练习 - 图文
- 2013--2014年小学六年级数学毕业水平检测卷及答案
- 江苏省2017-2018学年高考模拟历史试题分解(现代世界经济) Word版
- 移动通信实验指导书
- 2017-2018年最新审定新人教版六年级语文新人教版小学语文六年级
- 会展案例分析教案
- 数据库复习题
- 情智作文之学会选材
- 高一年级十月月考地理试题
- 河南省教育科学“十三五”规划2018年度一般课题立项名单
- 大学生宿舍文化现象调查与分析
- 山东省潍坊市2010届高三第二次模拟考试 理综 Word版
- 风险管理简答题
- 大连广播电视大学
- 民航安全管理经典论文
- 白皮书
- 数据
- 碧桂园项目施工组织设计
- F5负载均衡器配置指导书v1.02 - 图文
- 《信息系统安全等级保护定级报告》
- 汕头潮阳区教师上岗考教育学知识点汇总
- 中式烹调师初级试题
- finalterm review公司理财复习题
- R的极客理想-中学数学 导数 概率 连续分布-R语言
- 2017-2022年中国低合金卷行业分析及投资趋势研究报告
- 钒酸铁文献综述
- 城乡规划管理与法规
- 2006-2010二级建造师实务真题合集
- 浅谈新时期教师的形象
- 大班教育随笔记录(精品10篇)
- 建设工程施工现场安全生产保证体系管理资料(下册 1)
- 2019年中考政治复习专题训练 中考模拟卷辨析题整理
- 105平方冷凝器的选型及工艺计算 毕业设计
- STM32的嵌套中断系统NVIC详细整理
- 跨区域考核办法
- 2013年二级建造师机电工程案例汇总
- 八年级上册新课标第一章第二节众多的人口教案设计doc