数据仓库,英文名称为Data Warehouse,可简写为DW或DWH

  • 数据仓库需求定义

    它不是一个关于技术的系统,而是解决用户问题和面向用户提供战略信息的系统。在需求定义阶段,重点是用户需要哪些信息,而不是你如何提供这些信息。

    PHPYuan ( 2019/03/29 )

  • 数据中台VS数据仓库VS数据平台

    ▌数据中台和数据仓库、数据平台的关键区别这是现在数据行业大家经常讨论的问题,到底数据仓库、数据平台和数据中台的区别是什么。概括地说,三者的关键区别有以下几方面:◆数据中台是企业级的逻辑概念,体现企业D2V的能力。

    PHPYuan ( 2019/03/27 )

  • 数据仓库建设1——数据仓库基础

    数据仓库是一种能把各种源数据库集成成一个统一的目标数据库,并能把数据转换成面向主题的格式。能从异构的数据源中定时抽取、转换、集成所需的数据,便于用户最终访问,并基于时间维度进行分析。

    PHPYuan ( 2019/03/14 )

  • 数据仓库建设2——数据仓库模型设计

    数据仓库模型设计1.数据仓库模型 数据模型:实体、属性、实体之间的关系对业务概念和逻辑规则进行统一的定义、命名和编码,主要描述企业的信息需求和业务规则,是业务人员和开发人员沟通的语言。

    PHPYuan ( 2019/03/14 )

  • 开源数据仓库解决方案GreenPlum

    GreenplumDB号称是世界上第一个开源的大规模并行数据仓库。特别是面向大数据方面的分析能力,支持大数据的超高性能分析查询。

    PHPYuan ( 2019/03/09 )

  • 华为云企业级数据仓库DWS入选Forrester Wave报告

    CloudDataWarehouseQ42018"研究报告,华为云企业级数据仓库成功上榜。其实早在2017和2018年初Gartner发布的数据管理解决方案魔力象限中。

    PHPYuan ( 2018/11/30 )

  • 如何设计逻辑数据仓库

    建立在上一篇文章数据虚拟化环境设计步骤分解的基础上,为大家介绍设计逻辑数据仓库架构的两种方法。一种是从传统数据仓库架构迁移到逻辑数据仓库架构,一种是从头设计逻辑数仓架构。

    PHPYuan ( 2018/11/23 )

  • Cloudera助力英国银行Santander新一代数据仓库诞生!

    前言本文概述了Santander英国银行如何利用最新的Cloudera技术和卓越的软件开发能力创建下一代数据仓库和流媒体分析,以支持智能地改善客户关系。

    PHPYuan ( 2018/11/21 )

  • 基于erp下建立数据仓库简单步骤及注意事项

    自身转型、优化整合资源成为企业要考虑问题的重点之一。本篇仓管云以数据仓库为主体,简单介绍基于erp下建立数据仓库简单步骤及注意的问题。

    PHPYuan ( 2018/11/16 )

  • 盘点数据集市和数据仓库的差异(附链接)

    当一家企业开始应用商业智能的战略和技术时,首先需要明确数据集市和数据仓库的区别。理解这种差异将决定你采用何种BI架构和数据驱动决策。

    PHPYuan ( 2018/11/15 )

  • 数据仓库和数据湖泊之间有什么区别|Martech知识点

    如果你问市场营销人员:他们是否喜欢将他们的数据比喻为建筑物或水体之类的东西,会显得有点奇怪。在存储到仓库之前,数据通常会被仔细筛选和处理,如果某种信息具有法律约束力且需要可追踪的话,便会被数据库优先选择。

    PHPYuan ( 2018/11/15 )

  • 独家|一文盘点数据集市和数据仓库的差异(附链接)

    作者:ByGiladDavidMaayan翻译:王雨桐校对:丁楠雅本文约1600字,建议阅读10分钟。

    PHPYuan ( 2018/11/11 )

  • 第五届世界互联网大会|Kyligence 打造融合、智能的数据仓库

    11月7日至9日,由国家互联网信息办公室与浙江省人民政府共同主办。再一次聚焦全球目光,本次大会以“创造互信共治的数字世界——携手共建网络空间命运共同体”为主题。

    PHPYuan ( 2018/11/10 )

  • 苏宁数据仓库应对数据爆发式增长的技术演进

    随着公司业务不断发展,数据种类和存储呈现爆发式增长,繁多的业务数据如何被各业务中心分析和使用。如何有效组织和管理大量业务数据,减少大数据平台相近逻辑重复计算、相近数据重复存储,都将面临巨大挑战。

    PHPYuan ( 2018/11/09 )

  • 数据仓库?你有听说过吗

    一数据仓库之父是啥首先,我们引用数据仓库BillInmon的定义来证明自己的博学多才。我们先提取出定义中的关键字:面向主题,集成,随时间变化,非易失,数据集合,支持决策,管理者。

    PHPYuan ( 2018/11/09 )

  • 苏宁数据仓库应对数据爆发式增长的技术演进

    为什么需要数据仓库随着公司业务不断发展,数据种类和存储呈现爆发式增长,繁多的业务数据如何被各业务中心分析和使用。

    PHPYuan ( 2018/11/08 )

  • 专访常雷:“破旧立新”的偶数科技焕发新一轮生机!

    2018年10月17日,偶数科技创始人常雷作为第十届中国系统架构师大会的特邀演讲嘉宾在会上进行了《新一代数据仓库OushuDB演进之路》的主题演讲。

    PHPYuan ( 2018/11/07 )

  • Cloudera|传统数据库向大数据的渐进式转型

    传统数仓面临以下局限性1.存储成本较高,在线保留全量、海量数据的目标难以实现;2.元数据定义僵化,难以灵活集成多种数据源、支持即席查询;3.集群管理复杂、计算资源有限,缺乏统一的管理接口及水平扩展能力;4.随着数据规模、用户规模的不断增加,实时分析SLA无法满足;5.常用的数据分

    PHPYuan ( 2018/11/06 )

  • 苏宁大数据离线任务开发调度平台实践

    1.背景在数据仓库的建立过程中,核心技术是抽取、转换、装载,它为数据仓库提供及时、高质而准确的数据。

    PHPYuan ( 2018/11/06 )

  • Europa,国内通信行业首次大规模使用的大数据科学平台

    其在2001年就启动了数据仓库系统规划和建设的工作,从2003年开始建设,到2015年数据仓库数据超过100PB。

    PHPYuan ( 2018/11/06 )

  • 1年将30PB数据迁移到Spark,eBay的经验有何可借鉴之处?

    Teradata在过去的二十年为eBay提供了非常优秀的数仓服务,支撑起了eBay庞大的业务规模。二十多年积累下来的数据已经将数据仓库变得非常庞大。

    PHPYuan ( 2018/11/03 )

  • 百度大数据开发套件-「鲁班」亮相中国国际大数据大会

    2018年10月18-19日,第二届中国国际大数据大会在京盛大召开,百度大数据部应邀在会议上进行发言。

    PHPYuan ( 2018/11/02 )

  • 大数据发展或成为互联网金融发展核心

    近两年“互联网+”的出现让信息不对等的状态逐步向市场化、功能化的方向演变,使得大数据能够以数据平台形式。

    PHPYuan ( 2018/11/01 )

  • 企业大数据应用与实际不符,多半是因为······

    近年来,越来越多的公司已经意识到数据分析可以带来的价值,并且已经搭上了大数据的顺风车,引入了数据仓库、可视化工具等。

    PHPYuan ( 2018/10/31 )

  • 数据分析必不可少的——仓库基本架构

    数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持。数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据。

    PHPYuan ( 2018/10/27 )

  • Oracle从18c开始支持Linux 上的 Oracle 数据库 RPM 安装方式!

    Oracle开始支持Linux上的Oracle数据库RPM安装方式,虽然刚刚发布还有一些限制,但是这无疑开始改变。

    PHPYuan ( 2018/10/25 )

  • 人工智能领域:想学习大数据要掌握些什么知识?

    基础技术覆盖数据采集、数据预处理、分布式存储、NOSQL数据库、多模式计算、多模态计算、数据仓库、数据挖掘、机器学习、人工智能、深度学习、并行计算、可视化等各种技术范畴和不同的层面。

    PHPYuan ( 2018/10/21 )

  • 程序员小灰-漫画:什么是数据仓库?

    可是,有一个猥琐男却偏偏想要统治整个世界。猥琐男想出一个馊主意,打造出几枚拥有魔力的戒指,免费送给不同种族的领袖,让他们可以更好地统治各自的族人。

    PHPYuan ( 2018/10/19 )

  • 美团点评基于 Flink 的实时数仓建设实践

    本文整理了常见实时数据组件的性能特点和适用场景。介绍了美团如何通过Flink引擎构建实时数据仓库,从而提供高效、稳健的实时数据服务。

    PHPYuan ( 2018/10/19 )

  • 云数据仓库Snowflake获4.5亿美元融资,估值达35亿美元

    云数据仓库Snowflake在最新一轮融资中筹集了近5亿美元,融资总额达到9.23亿美元。今年1月,该公司筹集的资金总额为4.73亿美元,而如今,它在一轮融资中筹集的资金几乎又增加了一倍,达到4.5亿美元。

    PHPYuan ( 2018/10/17 )

  • 如何将传统关系数据库的数据导入Hadoop?

    大多数企业的关键数据存在于OLTP数据库中,存储在这些数据库中的数据包含有关用户,产品和其他有用信息。

    PHPYuan ( 2018/10/17 )

  • 如何成为一个Spark高手?

    大数据的处理怎么能变快一点,答案是请用spark,因为它是基于内存的,可以有效减少数据的落地次数。而要想成为Spark高手,也需要一招一式,从内功练起:通常来讲需要经历以下几个阶段:一:熟练的掌握Scala语言Spark框架是采用Scala语言编写的,精致而优雅。

    PHPYuan ( 2018/10/17 )

  • 如何将传统关系数据库的数据导入Hadoop?

    大多数企业的关键数据存在于OLTP数据库中,存储在这些数据库中的数据包含有关用户,产品和其他有用信息。

    PHPYuan ( 2018/10/16 )

  • 群晖 NAS:不只是数据仓库,也是懂你的数据银行

    没接触过NAS的时候,会觉得这一个黑盒子咋就这么贵;初步了解以后,会觉得一个“网盘”也没啥稀奇。而如果进一步使用了以后,通常会开始琢磨NAS还能做些什么。

    PHPYuan ( 2018/10/15 )

  • 大数据技术纯干货,论:spark高手是怎样炼成的

    大数据的处理怎么能变快一点,答案是请用spark,因为它是基于内存的,可以有效减少数据的落地次数。而要想成为Spark高手,也需要一招一式,从内功练起:通常来讲需要经历以下几个阶段:一:熟练的掌握Scala语言Spark框架是采用Scala语言编写的,精致而优雅。

    PHPYuan ( 2018/10/14 )

  • 大数据Hadoop中Hive学习路线图

    近年来,随着互联网产品的普及,线上和线下的结合。而这种变化和发展让用户更加重视视觉的享受,从而大数据开发技术也越加被企业所看重。

    PHPYuan ( 2018/10/13 )

  • 大数据之Hive详解

    由于Hadoop本身在数据存储和计算方面有很好的可扩展性和高容错性,因此使用Hive构建的数据仓库也秉承了这些特性。大数据技术工程师有更多大数据精彩内容等你来看,还有大数据学习资料免费领取哦,回复关键字即可。

    PHPYuan ( 2018/10/13 )

  • “数据湖”和数据仓库有什么不同?

    而数据湖则存储的是没有经过任何加工的原始数据,没有目的性,先存了再说,以后再想怎么用。从服务用户差异上来看,数据仓库适合企业数据分析人员,而数据湖最适合数据科学家。

    PHPYuan ( 2018/10/12 )

  • 如何保证服务器的数据安全?重点是选对硬盘驱动器

    硬盘驱动器作为服务器的核心数据仓库,所有用户数据以及软件都存在于此,它的稳定、安全与否直接决定着服务器的数据安全。

    PHPYuan ( 2018/10/12 )

  • 如何使用云计算和大数据来支持数字化转型

    英国慈善机构Parkinson’sUK正在利用基于云的数据仓库更好地利用数据信息作为慈善事业的核心变革。

    PHPYuan ( 2018/10/12 )

  • 降低大数据分析门槛,Hashdata打造云端数据仓库

    企业云端数据仓库调研|李喆崔可家撰写|崔可家从单机数据库到分布式数据仓库,数据的存储和分析的方式在不断演进。

    PHPYuan ( 2018/10/11 )

  • 大数据处理必备的十大工具

    下面是用于信息化管理的大数据工具列表:1.ApacheHiveHive是一个建立在hadoop上的开源数据仓库基础设施。

    PHPYuan ( 2018/10/11 )

  • 大数据基础架构扫盲概述

    从总体上来了解大数据处理的基本系统架构和各个软件框架、数据仓库、计算引擎的使用场景。大数据基础架构扫盲概述1、Hadoop:最早诞生的大数据处理计算框架,由Java语言编写。

    PHPYuan ( 2018/10/11 )

  • 如何使用云计算和大数据来支持数字化转型

    英国慈善机构Parkinson’sUK正在利用基于云的数据仓库更好地利用数据信息作为慈善事业的核心变革。

    PHPYuan ( 2018/10/11 )

  • 大数据干货|论Spark高手是怎样炼成的

    SPARK大数据的处理怎么能变快一点,答案是请用spark,因为它是基于内存的,可以有效减少数据的落地次数。

    PHPYuan ( 2018/10/11 )

  • 漫画解读:什么是数据仓库?

    程序员小灰丨华研数据一个故事在很久很久以前,世界上生活着许多种族,有人类,有矮人,有精灵…可是,有一个猥琐男却偏偏想要统治整个世界。

    PHPYuan ( 2018/10/08 )

  • 腾讯内容平台系统的架构实践

    作者 | 孙子荀编辑 | 小智随着云结合微服务架构切实的提高了生产效率;深度学习不断深入内容处理的各个领域促进生产力的发展。

    PHPYuan ( 2018/10/07 )

  • BI 商业智能/数据仓库实施杂谈

    从最初接触BI商业智能到现在已经十多年的时间,一直以乙方角色工作。今天忽然想就BI在甲方公司的应用情况做些总结,以及提一些设想,也希望有兴趣的朋友一起交流。

    PHPYuan ( 2018/10/01 )

  • 你必须了解的大数据之智慧出行

    最近听到和看到最多的就是:大数据不可估量的前景以及它对未来人类生活方式惊人的改变。其实很多大数据的从业人员都觉得自己已经会大数据开发、搭建数据仓库、数据采集、数据清洗,待遇也还可观。

    PHPYuan ( 2018/10/01 )

  • 初探:企业数据湖治理最佳实践!

    数据湖正在成为一种越来越可行的解决方案,用于企业从大数据中提取价值,并代表早期大数据采用者合乎逻辑的下一步。

    PHPYuan ( 2018/10/01 )

  • 数据仓库模型说明

    在数据仓库的建设过程中,不仅会面临着公司业务迅速发展,业务系统迭代变更,需要对业务系统数据进行相应的整合,形成公司完整的统一数据视图。

    PHPYuan ( 2018/09/28 )

  • 大数据学习:Hadoop中Hive原理及安装

    ApacheHive™数据仓库软件有助于使用SQL读取,写入和管理驻留在分布式存储中的大型数据集。可以将结构投影到已存储的数据上。

    PHPYuan ( 2018/09/26 )

  • 研发费“张冠李戴”,企业补税2亿元!

    日前,国家税务总局厦门市税务局利用大企业数据仓库、税收风险管理软件及大企业税务审计软件等多个智能税务信息化工具。

    PHPYuan ( 2018/09/26 )

  • java实现任务调度

    最近的一个小项目是做一个简单的数据仓库,需要将其他数据库的数据抽取出来,并通过而出抽取成页面需要的数据,以空间换时间的方式,让后端报表查询更快。

    PHPYuan ( 2018/09/24 )

  • 数据仓库相关知识点

    OLTP主要是面向企业具体业务处理和实时查询操作的,管理的是当前企业或部门内部业务运作的数据,不涉及历史数据或不同组织部门的数据,操作除了查询,更多的是随着业务的运作而进行的插入、修改和删除等操作。

    PHPYuan ( 2018/09/21 )

  • Oracle自治数据仓库给DBA们带来了怎样的改变?

    不仅是因为Oracle董事会主席兼首席技术官拉里·埃里森称“self-driving”技术是他们做过最重要的事情之一,更是因为自动计算的飞速发展让DBA们人人自危。

    PHPYuan ( 2018/09/21 )

  • 吉安才子涂子沛新作出版 系阿里巴巴集团前副总裁 曾就读吉安一中

    在继代表作《大数据》《数据之巅》之后,“大数据三部曲”收官之作《数文明》已于近期正式开启预售。记者通过采访了解到,涂子沛,吉安人,1988年——1991年于吉安一中高中就读,是着名信息管理专家、科技作家。

    PHPYuan ( 2018/09/20 )

  • 数据仓库入门学习路线

    数据仓库及数据模型入门什么是数据仓库、数据仓库的意义、数据仓库核心概念、数据仓库的体系结构数据仓库设计关注微信公众号:大数据小世界,获取大数据系统学习路线,领取大数据学习资料建立数据仓库的步骤、数据的抽取、数据的转换、数据的加载、什么是数据模型、数据模型的常见类型、如何设计数据模

    PHPYuan ( 2018/09/19 )

  • 在大数据平台的构建过程中,为什么还需要逻辑模型呢?

    在数据仓库时代,逻辑模型可以说是一个基本的概念,是指为解决业务需求而定义的数据仓库模型解决方案。因为大数据并不是海市蜃楼,也需要从点滴做起,大数据甚至更需要用业务人员能懂的语言将数据的特征描述清楚,将数据间的关系说清,从而使大数据能够被使用者认可。

    PHPYuan ( 2018/09/15 )

  • Ebates希望云数据湖能摆脱ETL困境

    几年前,内部部署的数据湖是Ebates针对商业智能基础设施方面的问题所给出的答案。 设法将数据湖用作数据仓库,这是公司在数据湖方面经常遇到问题的做法之一。

    PHPYuan ( 2018/09/15 )

  • 大数据未来发展的致命瓶颈,或许你猜到了……

    在大数据发展的过程中,最缺少“学术圈”的理论指导。在数据仓库领域,还有教授提出一些基本的理论和框架。

    PHPYuan ( 2018/09/14 )

  • 白话数据仓库 之 数仓模型 之 关系模型

    最近我们接到几个单子,公司一个新员工使用以下格式将其存到数据库的一张表中:明星事件记录我一看就知道他想要用关系模型来存储这些数据,在关系模型中,数据的载体叫做关系数据库。

    PHPYuan ( 2018/09/13 )

  • Hive SQL解析过程详解

    当只有一个distinct字段时,如果不考虑Map阶段的Hash GroupBy,只需要将GroupBy字段和Distinct字段组合为map输出key,利用mapreduce的排序,同时将GroupBy字段作 为reduce的key,在reduce阶段保存LastKey即可完成

    PHPYuan ( 2018/09/13 )

  • 白话数据仓库 之 数仓架构

    一数据仓库之父是啥首先,我们引用数据仓库BillInmon的定义来证明自己的博学多才。我们先提取出定义中的关键字:面向主题,集成,随时间变化,非易失,数据集合,支持决策,管理者。

    PHPYuan ( 2018/09/11 )

  • 数据仓库-零售业务举例维度表设计细节-读书笔记(八)

    主要讨论的概念如下1. 维度属性,包括指标、数字话描述以及多层次2. 日历日期维度,加上当天时间维度3. 因果维度,例如:促销维度4. 退化维度,例如:交易数据号码日期维度日期维度和其他维度不同,可以提前建立日期维度表。

    PHPYuan ( 2018/09/09 )

  • 谷歌在其大数据分析平台中加入Ethereum亚博国际手机客户端链数据集

    该公司在一篇博客中宣布,已将Ethereum数据集用于智能合约分析。就像他们团队所解释的那样,创建该工具的目的是为了帮助制定业务决策。

    PHPYuan ( 2018/09/07 )

  • 谷歌将Ethereum亚博国际手机客户端链数据集加入其大数据分析平台

    据ccn消息,谷歌在博客上宣布。谷歌云Petabyte规模数据仓库解决方案BigQuery已经使以太坊数据集可用于探索智能合约分析。

    PHPYuan ( 2018/09/06 )

  • 职场那点事儿——部门打架,屁民遭殃

    今天原计划是写一篇职场技能的,但是发生一件事儿,真恶心,写给大家看看,出点主意。公司有多个部门,有A和B,其他部门不关这个事儿。

    PHPYuan ( 2018/09/06 )

  • Google通过其大数据分析平台深入了解以太坊亚博国际手机客户端链

    谷歌云的Petabyte规模数据仓库解决方案BigQuery已经使以太坊数据库集能够用于探索智能合约分析。

    PHPYuan ( 2018/09/05 )

  • 阿里云数据库HybridDB for PostgreSQL产品优势及应用场景

    云数据库HybridDB for PostgreSQL基于Greenplum Database开源数据库项目,并由阿里云深度扩展,支持OSS外部表、JSON数据类型、HyperLogLog预估分析等功能特性。

    PHPYuan ( 2018/09/05 )

  • 怎样培养数据分析能力

    一些个人的工作经验,希望对后来人有帮助。数据挖掘选择合适的机器学习算法大数据考虑用Map/Reduce得出结论,绘制最后图表循环到第二步到第四步,进行数据分析。

    PHPYuan ( 2018/09/05 )

  • 谷歌凭借其大数据分析平台研究以太坊亚博国际手机客户端链

    GoogleBigQuery,帕字节规模数据仓库解决方案,已经提供了以太坊数据集,以实现对智能合约分析的探索。

    PHPYuan ( 2018/09/05 )

  • 如何培养数据分析的能力?

    点图、抖动图;直方图、核密度估计;累计分布函数两个变量:散点图、LOESS平滑、残差分析、对数图、倾斜多个变量。

    PHPYuan ( 2018/09/05 )

  • 谷歌通过其大数据分析平台BigQuery深入了解以太坊亚博国际手机客户端链

    谷歌在博客上宣布,谷歌云Petabyte规模数据仓库解决方案BigQuery已经使以太坊数据集可用于探索智能合约分析。

    PHPYuan ( 2018/09/05 )

  • 阿里云大数据计算服务MaxCompute

    关于阿里云大数据计算服务MaxCompute的详细内容。它能提供快速、完全托管的PB级数据仓库解决方案,使您可以经济并高效的分析处理海量数据。

    PHPYuan ( 2018/09/01 )

  • hive与关系数据库到底有何差距

    下面这几段文字很好的描述了hive的特性:1.hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能。

    PHPYuan ( 2018/08/31 )

  • 五个顶级的大数据架构

    自从像AWS这样的公共云产品开辟了大数据分析功能以来,小企业通过挖掘大量的数据做到只有大企业才能做到的事情。

    PHPYuan ( 2018/08/31 )

  • 从数据产品经理视角,聊聊数据处理

    相比最后报表展示、分析报告、数据驱动,这一环往往耗时长、体现价值低,却牵一发而动全身。我们经常会听到,同一个功能数据分析结果截然相反,追溯原因发现在数据处理过程中,存在错误等。

    PHPYuan ( 2018/08/31 )

  • 数据湖很高大上?原来就是这么回事

    如果你对大数据有一定的了解,你就会知道为每秒生成的庞大数据量找到存储解决方案至关重要。在管理数据时,数据专业人员可以考虑使用数据仓库或数据湖作为数据存储库。

    PHPYuan ( 2018/08/30 )

  • 扣丁学堂大数据培训数据挖掘面试测试题分享

    1、有关数据仓库的开发特点,不正确的描述是:A.在完成数据仓库的实施过程中,需要对数据仓库进行各种测试。

    PHPYuan ( 2018/08/30 )

  • 数据产品必备技术知识:数据仓库入门

    爱数据学习社welcome数据仓库可以算是数据产品必须要了解的技术知识了。在一年前的数据产品求职分析中,其中技能要求这一项中,数据仓库可是占了一席之地的。

    PHPYuan ( 2018/08/29 )

  • Hive究竟是什么?

    hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能。

    PHPYuan ( 2018/08/29 )

  • 数据产品必备技术知识:数据仓库入门

    在一年前的数据产品求职分析中,其中技能要求这一项中,数据仓库可是占了一席之地的。而那几本经典书籍里面又过于理论,看起真是生不如死,而且数据产品并不是数据开发,可能了解一些入门的常识,有个大概的概念就可以了。

    PHPYuan ( 2018/08/28 )

  • PaaS 数据服务平台简介(下篇)

    导读:在上篇中,我们已经简单了解了宜人贷数据平台Genie的特点,并且掌握了数据平台发展历程的一些信息。

    PHPYuan ( 2018/08/28 )

  • 数据仓库-高级维度表技术-读书笔记六

    维度表连接维度表可以包含到其他维度表的引用。支架方式维度表连接比较的做法是将支架表的外键放入事实表中,而不是放置在基本维度中。

    PHPYuan ( 2018/08/26 )

  • 数据仓库-高级事实表技术-读书笔记五

    作为事实表的唯一主键列作用二:在ETL中,用作事实表行的直接标识符作用三:允许将事实表更新操作分解为风险更小的插入和删除操作蜈蚣事实表一些设计这为多对一层次的每层建立不同的规范化维度,并将所有外键包含在一个事实表中。

    PHPYuan ( 2018/08/25 )

  • 数据仓库-维度处理-读书笔记(四)

    当不同的维度表的属性具有相同的列名和领域内容时候,称为维度具有一致性2,有利于不同事实表的合并到同一报表中去3,在一致性维度的前提下,可以被所有事实表复用4,可以保证分析结果的一致性且减少开销缩减维度场景一。

    PHPYuan ( 2018/08/23 )

  • 一文读懂数据架构的进化史

    近期看到很多企业在设计自己的数据平台,以及选型一些数据分析工具,正好拜读了数据仓库之父的《数据架构。

    PHPYuan ( 2018/08/23 )

  • 关于数据仓库你知道多少?

    今天我们要说的是主题是——数据仓库,注意是仓库,不是数据库哦。首先我们要知道,数据仓库的建立为行业高层主管门系统的地组织、理解和使用他们的数据进行了战略决策提供了体系结构和工具。

    PHPYuan ( 2018/08/22 )

  • 数据仓库-事实表/维度表技术-读书笔记三

    数据仓库技术事实表技术简述事实表结构1,总是包含外键,且外键不能唯空。2,事实表的设计完全依赖业务活动,不受最终报表的影响。

    PHPYuan ( 2018/08/22 )

  • 10亿数据几秒展现,FineBI的分布式引擎到底什么“魔性”?

    最近在看关于大数据、数据仓库、数据架构的《数据架构:大数据、数据仓库以及DataVault》一书。大数据一直被定义为3V,但这些特征用于描述高速公路上运载的各种货物也没有问题。

    PHPYuan ( 2018/08/21 )

  • 如何选择高性能的数据分析工具,你需要看看数据架构的进化史!

    以及选型一些数据分析工具,正好拜读了数据仓库之父的《数据架构:大数据、数据仓库以及DataVault》一书,有些许感触,就来聊一下个人思考吧。

    PHPYuan ( 2018/08/18 )

  • 数据仓库-DW/BI架构对比-读书笔记二

    Kimball的DW/BI架构KimballDW/BI架构的核心元素Kimball分工明确,资源占用更加合理,调用链路少,整个DW/BI系统更加稳定、高效、有保障。

    PHPYuan ( 2018/08/16 )

  • 数据仓库架构该内部部署,还是上云?

    将数据集中到单一的事实使商业智能,战略和决策变得容易。无论你是使用传统的内部部署仓库还是基于云的仓库,都可以有利于实现业务目标,尽管方式略有不同。

    PHPYuan ( 2018/08/16 )

  • IT人,除了数据库,未来还要掌握这个工具!

    不晓得大家有没有发现,过去企业搞IT都强调上系统、搞流程,而近几年,IT相关的新闻、会议,都围绕数据。

    PHPYuan ( 2018/08/16 )

  • PaaS 数据服务平台简介(上篇)

    导读:本文将分上下篇讲解宜人贷的PaaS数据服务平台—Genie。在上篇中,我们首先简单介绍一下数据平台的发展历程,然后介绍宜人贷数据平台Genie的特点。

    PHPYuan ( 2018/08/16 )

  • 1元恶意竞标:中国联通大数据库招标曝丑闻

    一起不计成本、报价1元,获取中国联通项目的竞标事件,在大数据库行业引发震动。中招国际招标有限公司发布了关于2017-2018年中国联通总部数据域对内应用DW3.0应用软件迭代开发工程中标候选人。

    PHPYuan ( 2018/08/15 )

  • 星环科技1元报价竞标联通大数据库软件开发 低于成本价报价引质疑

    特约撰稿郑言本报 一起不计成本、报价1元,获取中国联通项目的竞标事件,在大数据库行业引发震动。中招国际招标有限公司发布了关于2017-2018年中国联通总部数据域对内应用DW3.0应用软件迭代开发工程中标候选人。

    PHPYuan ( 2018/08/14 )

  • 1元中标再现江湖:是谁拿下了联通项目招标“头彩”?

    正式公布中国联通总部数据域对内应用DW3.0应用软件迭代开发工程招标结果,共有3家企业进入中标候选人,最低报价仅为1元。

    PHPYuan ( 2018/08/14 )

  • 一直播千万用户级基于 Spark 的推荐系统设计与演进|活动通知

    开发过大数据平台、数据仓库、推荐系统。推荐系统算是一个比较成熟的系统,但是在以视频、图片为基础的场景下遇到了新的挑战,如何解决便成了各大直播平台思考的新问题。

    PHPYuan ( 2018/08/14 )

加入我们

热门文章