<<Information Storage and Management>> 读书笔记 之一

由于工作需要,开始学习存储方面的知识了。

同事推荐了一本书,说写得很好。从今天开始我将开始存储知识的学习之旅。

书名和封面都贴在下面。

image

介绍

**********************

信息存储是信息技术的核心。每时每刻,无论是个人还是大公司的IT用户都在创造大量的数字信息。即使是今天,却仍只有在存储工业里的人们才理解信息存储技术在IT基础架构的可用性,性能,完整性,优化性上所扮演的关键角色。在过去的二十年中,信息存储已经发展成了一项高度复杂的技术,为存储,管理,连接,保护,安全,分享,调优数字信息提供了各种解决方案。

随着信息和复杂产品的解决方案的指数级增长,对于信息存储专家的需要也是与日俱增。 IT管理者面临着雇佣和培养高度熟练的信息存储人才的挑战。

许多领先的大学里已经开始在普通计算机技术或信息技术的全部课目中加入存储技术的课程,但是很多当下的IT从业者甚至是拥有多年经验的从业者却未能从这种专业的教育中获益,所以许多门类的专家-包括应用程序专家,系统专家,数据库专家,网络专家们-并没有一个共同的对于存储技术能如何影响他们所擅长的领域的基本认识。

这本书的设计和创作是为了是专家和学生们对存储技术的各个方面都能有综合的认识。虽然书中用到的产品例子是来自EMC公司的,但是本书介绍的技术概念和原则能使读者容易地理解各个厂商的产品。

这本书有十六章,分为四个部分。高级话题是建立在前面所学到的章节的基础上的。

第一部分, “今日世界中的信息存储和管理”这四章涵盖了信息增长与挑战,定义了一个存储系统和他的环境,回顾了存储技术并介绍了存储系统的智能。

第二部分, “存储选项和协议”这六章涵盖了SCSI和Fibre channel架构,direct-attached storage(DAS), storage area networks(SANs), network-attached storage(NAS), Internet Protocol SAN(IP-SAN), content-addressed storage(CAS), 和storage virtualization。

第三部分, “商业可持续性和复制”这四章介绍了商业可持续性,备份还原, 本地数据复制, 远程数据复制。

第四部分, “安全和管理控制”这两张介绍了存储安全和存储基础架构的监控和管理。

这本书有一个附属网站,提供额外的更新的学习资料和阅读材料。访问:http://education.EMC.com/ismbook获取更多信息。

这本书可以作为EMC Proven Professional Information Storage and Management exam E20-001考试的教材。

第一部分 存储系统

第一章 介绍信息存储和管理

=============================

在我们的生活中, 信息正扮演越来越重要的角色。二十一世纪,生活在on-command, on-demand的世界里,我们正变为信息依赖者,这也就意味着我们随时随地需要信息。 我们每天访问互联网来搜索, 参与社交网络, 收发邮件, 分享视频与照片, 还有其他数不清的应用. 装备上了越来越多的生成信息的设备, 个人创建的信息已经超过了商业信息. 个人创建的信息在与他人分享的时候能创造价值. 创建出来后, 信息存储在设备本地, 诸如手机, 相机, 笔记本上. 为了分享这些信息, 他们需要通过网络被上传到数据中心. 观察到下面的事实是挺有趣的, 那就是信息虽然是个人创建的, 但信息却存储并在相对较少数量的组织中被管理. 下图描画了这有效的信息循环.

image

商业世界中, 信息的重要性,依赖性,和其庞大的量正持续不断的以令人惊讶的速度增长着. 对于依赖快速可靠的访问信息的商业来说, 这至关重要. 这些商业应用包括, 机票预订,电话账单系统, 电子商务, ATM, 产品设计, 存货管理, 电子邮件, 网络门户, 病人病历, 信用卡, 生命科学, 和全球资本市场.

信息关键性的增长对于商业来说已经放大了保护和管理数据的挑战. 企业必须管理的数据量已经驱使着采用策略来根据数据的价值来分来, 并在数据生命期里为它们设置用来对待这些数据的规则. 这些策略不仅仅提供商业级的金融价值和一般价值, 而且还为为企业的日常控制提供了管理价值.

数据中心吸纳在视信息存储为他们的主要组成元素, 外加应用程序, 数据库, 操作系统, 和网络. 存储技术正持续地与提供越来越高等级的各种特性的其他技术一起进化着, 这些特性包括:可用性, 安全性, 可扩展性, 高性能, 完整性, 大量性和可管理性.

本章描述了信息存储架构的进化, 从简单的直接挂载模式, 到复杂的网络互联技术. 它介绍了信息生命期管理(information lifecycle management -ILM)策略, 正是这项策略使的信息技术架构能和商业优先级得以联合.

1.1 信息存储

================

Businesses use data to derive information that is critical to their day-to-day
operations. Storage is a repository that enables users to store and retrieve this
digital data.

商业实体使用数据来导出信息, 这对他们每一天的行动至关重要. 存储是一种能够使用户存储和取回数字信息的贮藏技术.

1.1.1 数据

-----------------------

数据是纯事实的集合, 从中也许可以推导出结论的. 手写书信, 打印的书籍, 家庭照片, 录像带中的电影, 打印并适当的签署了的低压文件, 银行分类帐, 和账户所有人的存取款记录本都是各种数据的例子.

在计算机出现之前, 所采用的处理数据的过程和方法局限于很少的几种, 比如说纸张和影片. 今天相同的数据可以被转变为更加方便的形式, 比如电子邮件信息, 电子书, 位图, 或者数字电影. 这些数据可以通过电脑生成, 并用很多的0和1来表示, 正如下图所示的那样. 这种形式的数据成为数字数据, 并仅在电脑处理后才可以被访问.

image

伴随着计算机的进步和通讯技术的提升, 数据生成和分享的速率呈指数级增长. 下面是一个促使数字信息增长的因素的列表:

  • 信息处理能力的增长: 当下的计算机提供了处理和存储信息能力的显著增长. 这使得各种传统形式的媒体和信息转变为了数字格式.
  • 数字存储成本的降低: 技术的进步和存储设备成本的降低提供了低成本的解决方案, 从而鼓励了低成本存储设备的发展. 成本的节约促使了信息生成和存储的速率.
  • 可以负担的和更快的通讯技术: 数字数据分享的速度比传统的方法快非常多. 一封手写的书信可能要一周才能到达目的地, 而电子邮件只需要几秒钟就能到达收件人那里.

不贵,并且容易创建,收集, 和存储各种类型的数据, 加上日益增加的个体和商业的需要, 导致了数据增长加速, 流行的说法叫做数据爆炸. 数据有不同的用途和重要性, 所以个体和商业对数据爆炸的贡献也不太一样.

数据的重要性和关键性随着时间会有变化. 大多数的数据在短期很重要, 但是随着时间推移会变的不那么有价值了. 这支配着所使用的数据存储的解决方案. 个体在各种设备上存储数据, 比如说硬盘, CD, DVD, 或者USB闪盘.

商业生成大量的数据, 之后从中萃取有用的信息来导出商业价值. 所以, 商业需要维护数据, 并在很长的时间内确保数据的可用性.

进一步, 数据在关键性上会有不同, 还会需要特别的处理. 比如说, 法律和管理机构命令银行为他们的客户们精确地,安全地维护帐号信息. 有些商业处理百万个用户的数据, 并长时间确保信息的安全和完整性. 这需要存储设备有高可用性还有增强的安全特性可以在长时间内保持数据.

1.1.2 数据的种类

--------------------
数据根据存储和管理的方式可以被分类为结构的和非结构的(详见图1-3). 结构化的数据是严格按照行和列的格式来组织的, 以便于应用程序可以高效地获取和处理数据. 结构化的数据典型地是使用数据库管理系统(DBMS)来存储的.

image

数据的元素不能被存储在行和列中时, 那么它就是非结构化的, 所以商业应用程序获取和查询都比较困难. 比如说, 客户的联系方式可以被存储在各种格式, 便笺, 邮件, 商业卡片, 或甚至是诸如.doc, .txt, .pdf的数码文件格式. 由于数据的非结构化的特性, 所以客户关系管理应用程序处理数据会比较困难. 非结构化数据可能没有被需要的组件来为任何种类的处理或解释唯一地鉴定它自己. 商业应用主要关心的是管理非结构化的数据, 因为百分之80的企业数据都是非结构化的, 并且需要很多的空间和努力.

1.1.3 信息

--------------------
数据, 不管是结构化的还是非结构化的, 在通过有意义的方式展现之前都不能满足任商业和个体的任何目的. 商业需要为自身需要分析数据那数据才有价值. 信息就是从数据中衍生出来的知识和情报.
商业企业分析原始数据以便于发现鉴别有意义的趋势. 在这些趋势的基础上, 公司可以计划或修改他的策略. 比如说一个零售商通过分析客户的购买模式来鉴别出客户喜欢的产品和商标, 并且维持这些产品的存货数量.

高效的数据分析并不仅仅可以让已有的商业受益, 而且还可以通过创造性的使用数据的方式来为新商业机会提供潜力. 以求职网站为例, 为了网络更多的招聘者, 应聘者在各种带有搜索功能的网站上发布他们的简历. 这些网站收集简历, 为了潜在的雇主们集中发布这些建立. 另外的, 企业们也在求职网站上发布可用的职位空缺. 职位匹配软件用简历中的关键字和职位信息中的关键字做匹配. 通过这种方式, 职位搜索引擎使用数据并把它变为对雇主和雇员有用的信息.

由于信息对商业成功至关重要, 所以始终存在一个永恒的话题, 那就是信息的可用性和安全性. 针对数据可用和安全的法律考虑, 可不可修改的考虑, 合同义务的考虑也仅仅是在这些话题之外再添加些话题罢了. 在关键行业里, 比如说金融服务, 电子通讯, 制造, 零售, 能源等, 每小时的断线(即数据不可用)会带来上百万美元的损失.

1.1.4 存储

------------------- 
个人或商业实体创建的数据必须被存储起来, 以便于方便地访问来做更进一步的处理. 在一个计算环境中, 为存储而设计的设备被称为存储设备或简单存储. 基于数据的种类不同还有创建和使用的频率不同, 所使用的存储设备也有不同. 比如手机, 数码相机中的内存, DVD, CD-ROM, 个人电脑中的硬盘都是存储设备的例子.商业实体对存储数据有多种选择, 包括内部硬盘, 外部硬盘序列和磁带.

摘译自<<Information Storage Management>>

原文地址:https://www.cnblogs.com/awpatp/p/2828282.html