计算机专业数据仓库见习报告

时间:2022-07-23 02:24:00

计算机专业数据仓库见习报告

一、导读部分:

可见二者差别之大,这只是数据库与数据仓库的一个概念性的大致区别。另外它编程人员最关心的建立与操作各方面也差别很大,因此如果你没有这方面的知识想只凭借数据库发面的知识来开发数据仓库的产品是很不可能的这就要求你要从数据仓库最基础的知识学起。

可能很多同学首先就会想到数据库,说起数据仓库。终究就错了一个字,但是就是这一个字使这二者差异很大:

即数据库为中心,保守的数据库技术是以单一的数据资源。进行事务处理、批处置等各种数据处置工作,主要是操作型处理,操作型处置也叫事务处理,指对数据库联机的日常操作,通常是对一个或一组纪录的查询和修改,主要为企业的特定应用服务的注重响应时间,数据的平安性和完整性。

用以支持经营管理中的决策制定过程,而数据仓库则是面向主题的集成的不可更新的稳定性)随时间不断变化(不同时间)数据集合。主要用于分析型处理(也叫信息型处置)分析型处置则用于管理人员的决策分析,经常要访问大量的历史数据。

二、数据仓库的基础知识:

1.数据仓库概念始于上世纪80年代中期,首次出现是在被誉为“数据仓库之父”WilliamH.Inmon的《建立数据仓库》一书中。随着人们对大型数据系统研究、管理、维护等方面的深刻识认和不断完善,在总结、丰富、集中多行企业信息的经验之后,为数据仓库给出了更为精确的定义,即“数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合”。数据仓库并没有严格的数据理论基础,也没有成熟的基本模式,且更偏向于工程,具有强烈的工程性。通常按其关键技术部份分为数据的抽取、存储与管理以及数据的表现等三个基本方面。

数据仓库的重点与要求是能够准确、安全、可靠地从数据库中取出数据,经过加工转换成有规律信息之后,再供管理人员进行分析使用。数据仓库主要是应用于决策支持系统,其主要目的是“提取”信息并加以扩展,用来进行处理基于数据仓库的决策支持系统(DSS)的应用。

2基于数据仓库的决策支持系统基于数据仓库的决策支持系统(DSS)由三个部件组成:数据仓库技术(Datawarehousing),联机分析处理技术(OLAP,On—LineAnalyticalPro—cessing),数据挖掘技术(DataMining)。

联机分析处理(OLAP,On—AnalyticalPro—cessing)是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业给特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。OLAP的目标是满足决策支持或多维环境特定的查询和报表需求。数据仓库侧重于存储和管理面向决策主题的数据;而OLAP侧重于数据仓库的数据分析,并将其转换成辅助决策信息。OLAP的一个主要特点是多维数据分析,这与数据仓库的多维数据组织正好形成相互结合、相互补充的关系。问此,利用OLAP技术与数据仓库的结合可以较好地解决传统决策支持系统既需要处理大量数据又需要进行大量数值计算的问题。

OLAP的多维数据分析主要通过对多维数据的维进行剖切、钻取和旋转来实现对数据库所提供的数据进行深入分析,为决策者提供决策支持。多维结构是决策支持的支柱,也是OLAP的核心。

数据挖掘(DataMining)是从大量的、不完全的、有噪声的。模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

数据挖掘可以看成是一种数据搜寻过程,它不必预先假设或提出问题,但是仍能找到那些非预期的却令人关注的信息,这些信息表示了数据元素的关系和模式。它能挖掘出数据键潜在的模式(pattern),找出最有价值的信息和知识(knowledge)。指导商业行为或辅助科学研究。研究对象是大规模和超大规模的数据集合。

三:在建立数据仓库时应该注意的重点问题:

1.找清楚主题,主题是你的数据仓库研究的一个大方向,如果你把这个都没有弄清楚的话后面的工作都是白费了。一般数据仓库的主题就是客户最关心的部分,是客户的项目做好以后在运行期间时常进行操作和观察的核心内容。只要你在建立的前真正弄清楚了客户的需求,一般主题的建立就不会出问题。

2.维度的建设,说白了维度就是客户的使用分析处理是的一个观察角度,数据仓库是多维的,也就是用户在观察的时候是从多个角度来观察的。这就要求你在具体的多维数据建立前要把用户的业务模型建立完备,一般这是一个迭代的过程,在建立好或修改好一个模型后最好和用户沟通一下,然后根据用户的要求再做相应的修改,另外基础数据库里面的维度表也要同步,把实际用到的维度都能在数据库里有所反应。

3.维度层次的建立:维度层次其实就是用户在观察时能够细化的单位,也可以说是一个范围,它是用户在进行切片,上钻,下钻时的重要单位,在建立层次的时候首先是要搞清楚要有那些层次,这个通常是用户要求的,然后在基础数据库建立的时候一定要把这些层次的顺序弄清楚,现在的数据仓库工具大多都是自动对你提供的数据表进行搜索而发现维度层次的,要是的建立基础数据表的时候不注意可能你以后得出的结果就会错很远。

四:总结:

1.找实习工作的认识:

我觉得实习其实就是一个从大学生活到工作的一个过度阶段,学校和社会差别很大。有很多学生在学校里对自己以后工作的事想的少,准备的少,一旦步入社会自己心里上一片空白,在实习时对于自己到底干什么工作,自己有什么专业技能也不是很清楚,最后总是过了很久快返校时才找到实习单位。我认为实习很重要,因为实习和正常上班没有什么两样,如果实习时就没有方向的话,以后工作了想找到方向会走弯路。还有对于大多数同学来说,先就业,在择业是最好的,毕竟自己在学校里接触社会少,专业实际操作和运用能力与实际工作要求还是有一定的差距,不要老想着自己一定要找到一份好工作,自己专业内的工作,自己喜欢的工作,这样是不切合实际的。

2.工作总结:在日常的工作中也有很多小问题值得我们注意,我总结了一下几条:

①最好每天都能做工作日记,早上上班前写好自己在这一天的工作目标,工作中应该注意的重点问题,有哪些事情是要问清楚主管的等。然后在每天的下班前在看一下自己当天做了那些工作,哪些工作目标没有完成,为什么没有完成,自己在以后的工作中应该注意哪些问题……,这些将是很重要的,经常看看会有很大进步。

②在开发项目的时候最好每天都有一个备份机制,因为电脑出故障是时常发生的,如果没有备份的话可能会发生前功尽弃的可能。

③在开发时遇到需求说明不是很清楚的地方一定要向上级主管问清楚,因为软件是做给客户用的,我们不能凭空想像,那样开发出来的东西很有可能会返工。

④在工作中可能会碰到和你的顶头上司发生矛盾的事,如果已经发生了,你要想清楚为什么会发生这种事,这些事情能不能避免,如果能避免自己在日后的工作中就要多注意一些。

⑤在讨论问题时要有自己的见解,不能人云亦云没有见解。

⑥工作要踏实,认认真真做。

⑦要多总结,多交流。

以上就是我在数据仓库实习期间自己的一些认识和看法,可能还有很多东西自己平时没有注意到,我也希望,祝愿每一位实习生包括我自己能够在日后的工作中取得更大进步。