物联-方案定制承诺守信「态物科技」
数据模型简介在神策分析中,我们使用事件模型event 模型来描述用户在产品上的各种行为,这也是神策分析所有的接口和功能设计的依据。
简单来说,事件模型包括事件event和用户user两个实体,同时配合物品item实体可以做各种维度分析,在神策分析中,分别提供了接口供使用者上传和修改这两类相应的数据,在使用产品的各个功能时,这两类数据也可以分别或者贯通起来参与具体的分析和查询。
逻辑数据模型逻辑数据模型logical data model,是一种面向数据库系统的模型,是具体的dbms所支持的数据模型,如网状数据模型(network data model)、层次数据模型(hierarchical data model)等等。此模型既要面向用户,又要面向系统,主要用于数据库管理系统dbms的实现 。
物理数据模型物理数据模型physical data model,是一种面向计算机物理表示的模型,描述了数据在储存介质上的组织结构,它不但与具体的dbms有关,而且还与操作系统和硬件有关。每一种逻辑数据模型在实现时都有其对应的物理数据模型。dbms为了---其独立性与可移植性,大部分物理数据模型的实现工作由系统自动完成,而设计者只设计索引、---等特殊结构。
维度建模
1、维度和指标的概念
按照维度表、事实表构建数据模型,通过指标评价企业经营活动。
维度一般包括:地区、时间、部门、产品等等。
指标一般包括:销售数量、销售金额、平均销售金额等等。
2、星型模型
星型模是一种---的数据关系,它由一个事实表和一组维表组成。每个维表都有一个维作为主键,所有这些维的主键组合成事实表的主键。强调的是对维度进行预处理,将多个维度集合到一个事实表,形成一个宽表。这也是我们在使用 hive 时,经常会看到一些大宽表的原因,大宽表一般都是事实表,包含了维度关联的主键和一些度量信息,而维度表则是事实表里面维度的具体信息,使用时候一般通过 join 来组合数据,相对来说对olap 的分析比较方便。
数据建模的具体过程可分为六大步骤:
一、制订目标
制订目标的前提是理解业务,明确要解决的商业现实问题是什么?
如:在-kol中,存在假粉丝的情况,如何识别假粉就是一个要解决的现实问题。
二、数据理解与准备
基于要解决的现实问题,理解和准备数据,一般需要解决以下问题:
1.需要哪些数据指标即特征提取?如:哪些指标能区别真粉和假粉?
2.数据指标的含义是什么?
3.数据的如何?如:是否存在缺失值?
4.数据能否满足需求?
5.数据还需要如何加工?如:转换数据指标,将类别型变量转化为0-1哑变量,或将连续型数据转化为有序变量
6.探索数据中的规律和模式,进而形成假设。
需要注意的是,数据准备工作可能需要尝试多次。因为在复杂的大型数据中,较难发现数据中存在的模式,初步形成的假设可能会被很快推到,这时一定要静心钻研,不断试错。
数据建模后需要评估模型的效果,因此一般需要将数据分为训练集和测试集。
联系时请说明是在云商网上看到的此信息,谢谢!
本页网址:https://www.ynshangji.com/xw/26691776.html
声明提示:
本页信息(文字、图片等资源)由用户自行发布,若侵犯您的权益请及时联系我们,我们将迅速对信息进行核实处理。