怎样的架构设计才是真正的数据仓库架构

如题所述

举报该问题

推荐答案 2020-05-18

一直想整理一下这块内容，既然是漫谈，就想起什么说什么吧。我一直是在互联网行业，就以互联网行业来说。
先大概列一下互联网行业数据仓库、数据平台的用途：

整合公司所有业务数据，建立统一的数据中心；

提供各种报表，有给高层的，有给各个业务的；

为网站运营提供运营上的数据支持，就是通过数据，让运营及时了解网站和产品的运营效果；

为各个业务提供线上或线下的数据支持，成为公司统一的数据交换与提供平台；

分析用户行为数据，通过数据挖掘来降低投入成本，提高投入效果；比如广告定向精准投放、用户个性化推荐等；

开发数据产品，直接或间接为公司盈利；

建设开放数据平台，开放公司数据；

。。。。。。

请点击输入图片描述

网站日志：

业务数据库：

来自于Ftp/Http的数据源：

其他数据源：

业务产品

报表

即席查询

OLAP

其它数据接口

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/WOvWXjevtWBtWvjOvvO.html

其他回答

第1个回答 2016-06-12

是数据仓库系统的基础，是整个系统的数据源泉。通常包括企业内部信息和外部信息。内部信息包括存放于RDBMS中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等等；
数据的存储与管理
是
整个数据仓库系统的核心。数据仓库的真正关键是数据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库，同时也决定了其对外部数据的表现形
式。要决定采用什么产品和技术来建立数据仓库的核心，则需要从数据仓库的技术特点着手分析。针对现有各业务系统的数据，进行抽取、清理，并有效集成，按照
主题进行组织。数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库（通常称为数据集市）。
OLAP服务器
对分析需要的数
据进行有效集成，按多维模型予以组织，以便进行多角度、多层次的分析，并发现趋势。其具体实现可以分为：ROLAP（关系型在线分析处理）、
MOLAP（多维在线分析处理）和HOLAP（混合型线上分析处理）。ROLAP基本数据和聚合数据均存放在RDBMS之中；MOLAP基本数据和聚合数
据均存放于多维数据库中；HOLAP基本数据存放于RDBMS之中，聚合数据存放于多维数据库中。
元数据是描述数据仓库内数据的结构和建立方法的数据。可将其按用途的不同分为两类，技术元数据和商业元数据。
技术元数据是数据仓库的设计和管理人
员用于开发和日常管理数据仓库使用的数据。包括：数据源信息；数据转换的描述；数据仓库内对象和数据结构的定义；数据清理和数据更新时用的规则；源数据到
目的数据的映射；用户访问权限，数据备份历史记录，数据导入历史记录，信息发布历史记录等。
商业元数据从商业业务的角度描述了数据仓库中的数据。包括：业务主题的描述，包含的数据、查询、报表；
元
数据为访问数据仓库提供了一个信息目录（informationdirectory），这个目录全面描述了数据仓库中都有什么数据、这些数据怎么得到的、
和怎么访问这些数据。是数据仓库运行和维护的中心，数据仓库服务器利用他来存贮和更新数据，用户通过他来了解和访问数据。
为了特定的应用目的或应用范围，而从数据仓库中独立出来的一部分数据，也可称为部门数据或主题数据（subjectarea）。在数据仓库的实施过程中往
往可以从一个部门的数据集市着手，以后再用几个数据集市组成一个完整的数据仓库。需要注意的就是在实施不同的数据集市时，同一含义的字段定义一定要相容，
这样在以后实施数据仓库时才不会造成大麻烦。
国外知名的Garnter关于数据集市产品报告中，位于第一象限的敏捷商业智能产品有
QlikView,
Tableau和SpotView，都是全内存计算的数据集市产品，在大数据方面对传统商业智能产品巨头形成了挑战。国内BI产品起步较晚，知名的敏捷型
商业智能产品有PowerBI, 永洪科技的Z-Suite，SmartBI，FineBI商业智能软件等，其中永洪科技的Z-Data
Mart是一款热内存计算的数据集市产品。国内的德昂信息也是一家数据集市产品的系统集成商。
为用户访问数据仓库提供手段。有数据查询和报表工具；应用开发工具；管理信息系统（EIS）工具；在线分析（OLAP）工具；数据挖掘工具本回答被提问者采纳

相似回答

数仓分层设计架构 详解-ODS-DWD-DWS-ADS答：首先，我们来深入探讨一下数据仓库的分层架构：ODS、DWD、DWS和ADS。ODS层（原始数据准备）: 这是数据仓库的基石，原始数据在此进行初步处理，包括数据抽取、清洗和存储。例如，通过日志数据源，如Kafka，接收并整理成Impala外表和Parquet格式，以适应高效的存储和查询。对于事务性强的日志表，增量存储策略能...

详解数仓分层设计架构ODS-DWD-DWS-ADS答：数据仓库架构通常分为四个主要层次：数据仓库ETL层、ODS层、CDM层（包含DWD和DWS两部分）以及ADS层。这些层次各有其功能，帮助企业在数据管理中实现高效和准确性。数据仓库ETL与ELTETL（抽取、转换、加载）或ELT（抽取、加载、转换）是数据集成的核心步骤，前者在源系统后处理数据，后者则在仓库中进行。E...

详解数仓分层设计架构ODS-DWD-DWS-ADS答：首先是数据的入口和加工枢纽：ETL层（Extract-Transform-Load）。它如同数据的高速公路，负责从各种业务系统和源头提取（Extract）、清洗与转换（Transform），然后将数据准确无误地加载（Load）至数据仓库，确保数据的流动和一致性。

数据仓库各层该如何设计数据模型?答：数据仓库各层次设计：实时处理与高效分析在现代商业环境中，企业对实时数据的需求日益迫切，传统离线数据仓库的时效性已无法满足决策者即时的需求（T+1）。随着实时计算框架的成熟，如Apache Storm、Spark Streaming和Flink，实时数仓的建设不仅解决了离线数仓的不足，还扩展了应用场景，涵盖实时OLAP分析、数据...

数据仓库是怎么分层的?答：深入解析：数据仓库的层次结构详解让我们一起探索数据仓库的神秘世界，从底层到顶层，每一步都至关重要。首先，让我们聚焦在一张详尽的架构图上，这里涵盖了数据仓库的四个关键层次：数据仓库ETL层、ODS层、CDM层以及ADS层，每一个都是数据仓库生态系统不可或缺的组件。从底层开始，数据仓库的基石是ETL...

数据平台整体架构篇答：2、离线数据仓库离线数据仓库是数据平台核心工具之一，主要为T+1数据报表做数据准备。离线数据仓库在设计方面一共分为4个层次，分别是ods、dwd、dws、dw四个层次，其中ods和原始数据相同的数据结构，dwd层主要采用维度建模或DV模型的通用数据仓库模型。将公司的各条业务线用统一的数据模型进行数据组织，...

数据工作日志(二)企业数据仓库总线架构答：总线架构的核心在于其标准化接口，类似于计算机硬件的总线，使得不同来源的数据能够无缝集成。数据仓库总线通过公共维度实现跨业务领域的整合，避免了以往建设中的宏观或微观困境。它是一个跨技术平台的架构，有助于维护数据一致性。实现总线架构，关键在于数据仓库总线矩阵的应用。这个矩阵以表格形式展示了业务...

数据库架构是什么答：SQL Server 默认使用一个名为 dbo 的构架。问题六:数据库-架构和数据库-管理指的是什么数据库架构: 下面是基于SQLserver数据库来谈的。贰 SQLServer经过这些年的发展,其实已经有很多很好的技术可以使用,如Replication、SSB、Cluster、Mirroring等(可以参考我在SQLServer DBA 三十问和SQLServer 高可用、高性能...

数据仓库 | Kimball与Inmon两种体系架构答：两种主要的体系架构，Kimball与Inmon，各有其独特设计。Inmon的企业信息化工厂强调数据集成，将操作型系统中的数据通过ETL过程整合到原子数据仓库，尽管仓库主要用于存储而非分析，但通过数据集市进行“数据交付”至分析系统。而Kimball的维度数据仓库则采用星型多维模型，更便于分析系统直接访问，拥有ODS层和展现...

大家正在搜

数据仓库的架构以及数据分层大数据数据仓库架构数据仓库的基本架构设计文件架构怎么设计数据仓库架构实时数据仓库架构数据仓库五层架构数据仓库三层架构淘宝数据仓库架构