当前位置: 首页 > news >正文

揭秘云计算 | 1、云从哪里来?

要搞清楚一个问题或一种现象,通常要从前因、后果、人、事、物之间的关联与分析入手,我们把以上5个方面简称为5W,也就是英文中的What-When-Where-Who-Why(什么−何时−何地−谁−为什么)的首字母。此外,也有5W1H的提法,比5W多了一个How(怎么)​。

对云计算的认知也不例外,我们要知道云是什么,云从哪里来、会到哪里去、可以做什么,为什么云计算在今天以至可见的未来会大行其道。

接下来,我将通过N篇连载,围绕云从哪里来?云的多重形态有哪些?关于云计算效率的讨论、业界如何建云等内容,对以上相关问题做相应的分析和解答。今天,先聊云是从哪里来的呢?

首先,我们需要知道云从哪里来,搞清楚谁是云计算的提出者至关重要。这大可上升到哲学的高度,可类比于千百年来科学家乃至全人类最关心的问题的核心,就是知道人从哪里来。

同理,知道云从哪里来可以更好地帮助我们预判云会朝哪个方向发展,会在何处融入、改变人们的工作与生活。

一、云计算科技史

云计算的起源众说纷纭,各种版本皆有。有人说,云计算起源于亚马逊公司最早在2006年推出的AWS(Amazon Web Services)。AWS提供的服务从早期的弹性计算云(Elastic Compute Cloud,EC2)、存储服务(Simple Storage Service,S3)发展到今天业界使用最为广泛的各类计算、网络、存储、内容分发、数据库、大数据管理与应用等。

也有人说云计算起源于Sun Microsystems公司在2006年3月推出的Sun Grid,它是一种公有云网格计算服务,CPU的租金为每小时一美元,采用和电费一样的计费模式——按使用量计费。不过,按照《麻省理工科技评论》刨根问底的结果,康柏(Compaq)公司1996年在内部商业计划文档中最早使用云计算(Cloud Computing)这一字样与图标。康柏公司关于云计算ISD策略的商业计划文档如图1-1所示。

图1-1 康柏公司关于云计算ISD策略的商业计划文档

二、云计算的三大要素

以上可以算作对云计算“冠名权”归属的一番浅究,事实上云计算的起源比以上诸多论断还要早,其发展历程贯穿了过去半个世纪全人类的IT发展史,云的起源及发展如图1-2所示。

图1-2 云的起源及发展(从20世纪70年代至今)

 (1)云计算要素之一:分时计算

20世纪70年代,这是大型主机如日中天的最后一个黄金10年,IBM公司在其大型主机与终端之间使用了一种叫远程任务输入或远程任务处理的机制。大型主机自20世纪60年代中期就已经普遍使用了虚拟化技术,其间最典型的应用就是分时,也就是说多个任务或者多个终端事先被分配好占用主机处理器完成任务的时间和优先级。从整体来看,大型主机处理各任务的过程就像是主机在同时服务与处理多个用户、多个终端的不同任务。发展到今天,从蜂窝网络到个人计算机(PC)上面的处理器再到手机终端,分时计算在我们的生活中可谓无处不在(笔者特意没有提到虚拟化即是云计算这一容易引起误解的概念)​。

(2)云计算要素之二:网络互联

从20世纪60年代末到20世纪80年代,有一件大事发生,那就是互联网的诞生与蓬勃发展。这里不得不提到两个网络:一个是高级研究计划局网络(Advanced Research Projects Agency Network,ARPANet),又称阿帕网;另一个是CSNet(Computer Science Network)。

阿帕网是美国国防部在20世纪60年代后期开始资助的用于研发包交换或分组交换技术的项目产物。阿帕网项目产生的一个原因是,在分组交换技术之前被电信公司广泛应用的是回路交换技术。相对于分组交换而言,回路交换使用点对点的固定通信线路,对资源的利用率较低。

阿帕网项目的产生还有另一个被广泛流传的原因,那就是当时正处于美苏冷战时期,北大西洋公约组织(简称北约)希望有一种网络通信方式,可以在受到核打击的情况下依然能完成信息交换。这一点被认为是美国国防部在20世纪60年代开始寻找更高效、更安全的包数据交换方式的主要原因。

互联网雏形是在1969年12月5日由4所位于美国西部的加利福尼亚大学洛杉矶分校、斯坦福大学(全称为小利兰·斯坦福大学)​、加利福尼亚大学圣芭芭拉分校和犹他州立大学间第一次形成的4节点分组交换网络,在此前一个月最早的“互联网级”信息传递网在加利福尼亚大学圣芭芭拉分校与斯坦福大学之间完成,传送的内容只是一个简单的单词login,而包交换技术仅仅在此一年前才被发明(互联网技术的发展速度由此可见一斑)​。

CSNet是美国国家科学基金会在20世纪80年代初开始资助的项目,是对阿帕网的有效补充(为那些由于受到资金或权限等限制而不能接入互联网的学校与机构提供帮助)​。此两者(阿帕网与CSNet)被公认为奠定了互联网的科技基石。

(3)云计算要素之三:网络安全与资源共享

20世纪80年代和90年代,IT行业最大的发展可以归纳为PC的兴起。PC的兴起带动了整个产业链上下游的蓬勃发展,从CPU、内存、外接设备到网络、存储、应用,不一而足。PC的广泛应用极大地提升了劳动生产效率,特别是在连接企业−部门−员工的应用情景下催生了对网络资源虚拟化、数据共享以及数据传输安全的强烈需求,使得一系列技术应运而生,如虚拟专用网络(在公共网络通道之上建立点对点的私密通信渠道)​、分布式计算(其本质就是让多台PC协同计算来实现只有大型主机、小型主机可以完成的任务)​。

21世纪的第一个10年,IT行业的发展可以简化为如下两个阶段。

第一阶段:2001—2005年,基于PC的虚拟化技术高速发展。虚拟化技术早在20世纪60年代就已经在大型主机上出现,不过真正得到广泛应用则是PC的兴起,PC的单机处理能力达到了需要通过虚拟化的方式来进一步提高PC资源利用率。

第二阶段:2006—2010年,云计算服务的推出与应用。第二阶段开启于2006年,在同一年内亚马逊(Amazon)、谷歌、Sun Microsystems公司先后推出了各自的云计算服务。2008年,微软公司推出了基于云计算的操作系统Microsoft Azure。同年,在美国国家航空航天局的资助下,OpenNebula开源云计算平台项目成立。两年后,美国国家航空航天局与Rackspace Hosting(美国得克萨斯州的一家互联网服务提供商)联手推出了OpenStack开源软件项目。在过去的数年中,OpenStack从早期模仿AWS发展到形成颇具特色的基础设施即服务(Infrastructure as aService,IaaS)平台,并逐渐地向下、向上拓展的生态系统。2016年前后,OpenStack几乎超越Linux成为全球更大更活跃的开源社区,但是故事并没有到此结束。以谷歌公司开源的Kubernetes和Docker为代表的容器大有取代OpenStack的架势,这又是后话。与此同时,AWS攻城略地,占据了公有云计算领域的半壁江山。

从目前来看,亚马逊公司仍是一家独大,但是谷歌公司提供了G Suite工具,以谋求在办公云方面的突破;IBM公司转向开源的产品架构,并率先涉足区块链领域,参与超级账本项目,希望借此发力……在中国市场,阿里云因先发优势而占据了半壁江山,其后则有华为、腾讯、百度、中国电信等公司,它们都在加速扩大自己的云计算服务规模。

以上两个阶段可概括为:PC→PC虚拟化→各种云计算平台及服务解决方案风起云涌。

三、云计算的本质

近几年,云计算的发展让人眼花缭乱。各种新兴技术风起云涌,其中值得一提的有两种,分别是容器计算和大数据。

我们前面提过虚拟化,基于虚拟机的虚拟化技术是对裸机这种形式的有效补充,而容器是对基于虚拟机的虚拟化技术的有效补充。容器的意义在于重新提高了因虚拟化而被降低的计算效率,后面的内容中我会专门论述相关内容。

如果说2006年开始的云计算浪潮多少有些偏重于底层的平台与服务,那么真正寻找到的与之匹配的就是近年来声名鹊起的大数据应用,两者算是一拍即合:云计算作为基础架构承载大数据应用,大数据通过云计算架构与模型提供解决方案,如图1-3所示。

图1-3 云计算与大数据融合

至此,我们总结一下到底什么是云计算。从技术角度来看,云计算是多种技术长期演变、融合的产物,诸如分布式计算、并行计算、网络存储、分布式存储、虚拟化、裸机及容器计算、负载均衡等计算机及网络技术。云计算底层技术的发展与融合如图1-4所示。

图1-4 云计算底层技术的发展与融合

云计算的本质是多种技术的融合,它和很多技术颇有相通之处,列举如下。

(1)C/S与B/S技术

C/S(Client/Server)泛指任何客户端到服务器端的双向通信机制和架构。B/S(Browser/Server)可被看作C/S架构的一种形式,也是目前最常见的网络节点间的通信方式。

(2)P2P技术

P2P(Peer-to-Peer)是一种分布式应用架构,它的核心理念是分而治之或者任务分区。

(3)并行计算

我们可以说C/S架构与任务分区二者合在一起就已经把云计算的技术本质描述出来了。云计算在本质上依然是一种分布式计算,与之相对应的技术是并行计算,它们之间的主要区别在于节点间的通信方式:分布式计算、云计算显然是通过信息实现节点间(节点在这里可以理解为CPU、主机或计算机集群)的通信,而并行计算通常会采用共享内存的通信方式。后者虽然效率更高,但是其可扩展性会受到一些限制。在某种程度上,并行计算可以看作一种特殊的分布式计算,特别是在小规模紧密集群或早期分布式计算的实现方式中经常可以看到并行计算的影子。 

四、云计算基本特征

从云计算服务的提供和需求的角度看,云计算具有5个基本特征,如图1-5所示。

图1-5 云计算的5个基本特征

(1)共享资源池

共享资源池指的是计算、网络、存储等资源的池化和共享。

(2)快速弹性

快速弹性指的是云计算能力在应对需求、负载变化时的可伸缩性,即自动化。原来需要几周、几个月完成的事情,现在可以在几秒、几分钟内完成,并且几乎不需要人工干预。

(3)可度量服务

可度量服务也是云计算非常重要的特征,其中包括对各项服务和应用的监控、计费等。

(4)按需服务+自服务

按需服务听起来很像某种人类文明高度发展的终极社会形态——按需分配,在云计算的背景下,它是为了减少重复建设、过度分配所造成的资源浪费。自服务则给予了用户极大的把控性,同时减少了维护成本。

(5)普遍的网络访问

普遍的网络访问指的是可以在任何时间、任何地点通过网络访问云计算资源。在这里,我们套用国际数据公司IDC在2013年提出的“3个平台”作为总结,如图1-6所示。

图1-6 IDC提出的“3个平台”

在这3个平台中,第一平台出现得最早,横跨了20世纪50—70年代,是大型主机、小型主机的天下,其受众主要是一些大型企业,服务于百万量级的用户对象和数以千计的应用;

第二平台是进入和连接了千家万户的PC时代,用户数量与程序应用分别达到了亿万量级和万量级;

第三平台颠覆了曾经颠覆第一平台的第二平台霸主PC,而接入用户的规模继续呈指数级增长,如果再算上物联网设备(如物联网级产品、各种可联网传感器)​,则用户规模可达到百亿甚至千亿量级,而程序应用也空前蓬勃发展,达到了百万量级。今天我们正处于大规模从第二平台向第三平台迁移与发展的关键阶段。

在下一篇中,我会着重讨论业务需求与IT交付能力之间的互动问题。

(文/孙宇熙 Ricky)

·END·


http://www.mrgr.cn/news/63425.html

相关文章:

  • vscode在cmake config中不知道怎么选一个工具包?select a kit
  • 如何解决Java EasyExcel 导出报内存溢出
  • 泛微开发洗脸之旅--49ecology生产环境中清除测试站内信测试消息的方法
  • 智能码二维码zhinengma.cn如何赋能工业产品质量安全追溯
  • 【DBeaver】连接带kerberos的hive[Apache|HDP]
  • 【AI开源项目】FastGPT- 快速部署FastGPT以及使用知识库的两种方式!
  • Redis(2):内存模型
  • 物联网设备如何助力实现高效远程老人监护
  • batc和mini-batch
  • Java面试题十五
  • 基于springboot的Java学习论坛平台
  • prometheus 快速入门
  • python enum用法
  • opencv - py_imgproc - py_grabcut GrabCut 算法提取前景
  • JavaScript 实战技巧:让你成为前端高手的必备知识3(进阶版)
  • 【环境问题】pycharm远程服务器文件路径问题
  • 【前端】项目中遇到的问题汇总(长期更新)
  • 热点扫描:人工智能专利布局背后的商业博弈
  • Java思想
  • 拒绝无效发稿!软文推广这样精选媒体,一不小心省下百万宣发费用!媒介盒子分享
  • 视频一键转换3D:Autodesk 发布 Video to 3D Scene
  • 【django】django RESTFramework前后端分离框架快速入门
  • dim的方向 傻傻分不清
  • BGP实验--BGP路由汇总
  • 苹果手机备忘录怎么看字数统计
  • WAF+AI结合,雷池社区版的强大防守能力