博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
我对数据仓库的感觉
阅读量:3606 次
发布时间:2019-05-20

本文共 2911 字,大约阅读时间需要 9 分钟。

我不知道该让这篇文章叫什么名。。。感觉写得有点乱。就暂叫:我对数据仓库的感觉 吧。
也许写得有不对的地方,请多包函。
对于数据仓库,我很早就看了一些相关的书,但由于客户一直没有相关的需求,所以仅仅知道MS有这么一个东西,但具体的东西是什么样的,我并不知道。
后来,看了杨大川的一个关于MSOLAP2000的录像,感到MSAS的功能非常的强大。看他演示了经典的数据挖掘--决策树,我心里就想,原来,数据的真正的意义在这里,后来他再
用普科(ProClarity)来演示分解树的时候,我觉得MSAS真是帅呆了。心里感觉,BI无所不能。未来,尤其是商业市场的未来,高端部分非数据仓库莫属。
就这样,一个演示的录像,让我走上了数据仓库之路。人的改变就是这样的偶然。
就这样,我决心要在这条路上走,无论多困难,我都要走。
买了十几本关于OLAP,NDX 的书,放在电脑包里,空闲时看看,上班坐公交车的路上看看,下班的路上看看。回家空闲时也看看。我并没有急于去掌握这门技术,我觉得,只要点
点滴滴,细水长流。我相信,再大的桶,也会有滴满的一天。
当我觉得书看得差不多了,于是,自己假想了一个简单的商业方案。用这个假想的方案去做一次实实际际的操作。呵呵,很顺利,这个假想的方案并不困难。很顺利地完了了。
水,终于滴到能看到的那一天了。当时我在某学会上班,里面,最充足的资源就是各种的统计数据,我选了一个最完整,最连续 的一个库---某某库。作为我第一个MSAS项目。
确定该项目为三个页面:第一个是普通的浏览,第二个页面是分解树,第三个页面是KPI。
功能或需求定位了,动手吧。。。。
重新做一个适适合数据仓库的库---就是反规格化的库。重新建立相关的可索引的视图,将原来的数据倒进去。建立仓库,写一个针对MSAS的类,写一个WEB的分解树的控件,
写了一个WEB展示的控件。最后,一个多月后,这个仓库出来了。我觉得很顺利。其间最大的收获是什么?写了关于MSAS的类,和OLAP的网络控件,让我知道MSAS返回的CELLSET是
什么东西,也让我的MDX更熟练了。  :)
早两三周前,我辞去了某学会的职务,变成了无业者。呵呵,我并没有急着找工作,觉得自己应该考虑一下自己的未来,我的未来在哪里?哪里是出路?
现在,已很少灵光一闪的思维了,该闪的事,几年前就闪过了。。。我觉得应该好好地沉淀一下,整理一下。在众多的技术面前,哪里有出路?我决定---还是BI。
不错,还是它,没人有什么东西比它对我更有吸引力的了,也没有什么比它更让我着迷的了。
但我知道,我只是刚开始,路,还是很的。
思考一下中国目前的BI现状,是什么现状?
企业对BI渴望,但对BI的价值评估严重不足,企业,一个用**3000,管*婆,管理的小工厂,用**CRM管理的客户,用某某*蝶,**MRP,**erp管理的大型企业。他到底需要BI的什么
?BI的哪部分?我看过一些企业的BI,充其量,就是一个报表。难道,在中国的企业,BI=报表 ?这就是需求?
/***********
插一个是外话:
如果BI仅仅等于多维的报表,我上几个月曾在CSDN里与人讨论过一个问题:用SQL模拟MDX的多维报表。后来,我下定决心,开发一个这样的WEB网格工具。一周的时间,我做出来的
。就是用SQLSERVER模拟的MDX WEB报表展示。仅仅从外表看,你还真分不出这是数据库。
其实,我开发这个报表的目的也是生产的需要,因为客户就是要这个报表就够了。多了反而部署困难。而开发的直接灵感或者说思路,则是原原版版的仓库的思路.
***********/
我突然想到,能不能将仓库与一些其它的工具配合起来,也许,BI会显得更完整。也会更容易.
我想到了MATLAB这个数学工具,MATLAB里有经典的工具箱,很多经典的算法,一些在其它编程语言很难做到的地方,它能轻易地做到,比如说,矩阵的运算,各种积分,多重积分
,各种微分,各种插值,各种的仿真工程,各种的规划求解。更重要的,它的数据可视化,绝对是无敌的数据可视化,杀伤力太大了。而它比其它任何一门计算机语言更容易懂。
我心里的未来之路就是:数据仓库与MATALB的结合。
这是模拟的效果。
BI实施最大的壁垒,我觉得还不是在技术,而是在人。
中国,所有事情,在国企,都是领导拍板(因为其它的人,都怕承担责任,承担责任的后果是可大可小的。:) )。在私企,多数是老板拍板。很多领导他根本就不明白BI。当你向他推荐BI时,我觉得最好要做一个例子去给他说明。BI不同数据库,数据库大家都上,都 必须用到,老大们就算不知道数据库为何物,但则于人人都上,都在搞信息化,他就觉得他也必须得上。但BI不同,由于BI的特殊性,用的人少,看的人也少。 大家都觉得糊里糊涂的。
再有BI的教育,现在从事这行的人太少了,我无论在哪个论坛的的仓库版块,都是最少的,最冷的。有些论坛贴子可能一两个月没有更新过。这也说明,做BI, 你想在周围找到知音,与你一起讨论,基本是不可能。至少我在编程这个行业有十年了,但做BI的人,在现实中我真的还没有遇到过。幸亏有了BBS,否则,你 注定孤独。
现在培训BI的地方好象也不多,我本来想参加一期培训的,但价格太高了。对于一个要养家糊口,又要还债的人来说,二万甚至几万块的培训费,我实出不起。而 且,根据以往一些同事参加过一些其它培训班后的感觉,我对培训后的结果也有点怀凝,总觉得,参加一期培训,还不如多看两本书,多做几个实验来得实在。
技术的路是不好走的,尤其是BI这条路。我上次参加过一次面试,一个技术经理跟我说:做技术的人在我们公司的地位是最低的,你能接受吗?其实,他不说我也知道,技术员,在多数的公司里,他的地步一直都是最低的。  :)
我觉得学习仓库与DELPHI不同,DELPHI是一门编程的语言,是很直接的东西。而仓库不是,他不是直接的。要得到最终的结果,它要经过很多的环节。
原始数据=》数据库=》仓库=》MDX或前台展示。
所以,这无疑又增加了学习仓库的成本,这个成本有多大呢?我觉得是很大的,打个比方,SQLSERVER版人很多吧,不仅仅因为 学/用 SQLSERVER的人多,而SQLSERVER它本身比较直接,某人在SQLSERVER问个比较复杂的问题,我可以立刻建立一个测试表,然后立刻写出 相关的SQL语句。然后得到结果,把答案一贴。OK。更多的情况是测试表都可以省略,直接在回复里打就行了。仓库行吗?他不行,我无法建立提问者相同的测 试环境,不可能花时间建立一个测试的立方去回答一个问题。所以,往往回答的结果是,问非所答。
所以,在仓库里提问题朋友,最好参描述你的立方,你用到的维,你的层,属性,度量,否则,回答的人只能给你挑一个例句。
杨大川说数据仓库学习难度比数据库要难5到10倍,我看差不多。它的学习曲线太陡了,很多人可能坚持不住。你学某门语言,可能一个月就有效果,学数据库, 可能一个月就收么效果,但数据仓库,学一个月人还在云里雾里。这对初学者的打击是非常大的,往往就会产生放弃的念头。
你可能感兴趣的文章
docker使用tomcat部署应用
查看>>
linux服务器之间复制文件
查看>>
k8s集群搭建
查看>>
自己的阿里云镜像加速器查找
查看>>
spring-cloud-eureka初体验
查看>>
spring-cloud-ribbon简单使用
查看>>
spring-cloud-feign的简单使用
查看>>
spring-cloud-hystrix简单使用
查看>>
docker批量删除镜像
查看>>
deeping操作系统修改已挂载卷名称
查看>>
设计模式之神奇的单例模式
查看>>
linux系统设置oracle开机自启
查看>>
数据库的五种索引类型
查看>>
设计模式之原型模式
查看>>
设计模式之建造者模式
查看>>
设计模式之代理模式
查看>>
设计模式之门面模式
查看>>
设计模式之装饰器模式
查看>>
设计模式之享元模式
查看>>
设计模式之组合模式
查看>>