全文3900余字,读完约需8分钟
每一家互联网公司和电信运营商都宣称要“连接人与XX”“连接一切”。电脑、手机、智能电视,覆盖衣食住行的互联网应用,让人每时每刻的一举一动,都通过划一划屏幕,点一点鼠标,置于信息世界的天网中。
为了互联网世界的流畅高速运转,数据中心们日夜不息,多重备份,应急保障,把自己搞得发烫。为了降温,需要大量的制冷设备。装满服务器、控电设备和制冷设备的数据中心,是超级电老虎。
工作日的早上,睁开眼的第一件事是什么?毫无疑问,拿过手机看一眼时间,再刷一下微信。用两秒钟,进入一天的互联网生活。
匆匆早饭后,点开打车软件,叫了辆车上班,一路用地图看实时路况,总算没迟到。到了公司,开电脑处理邮件,更新工作日志,开始上网查资料——公司的网总是那么慢,跟合作伙伴传文件,捉急起来还要拿手机开热点帮忙。
忙活一上午,不知不觉快12点了。外面大风起,手机上的天气APP提示要下雨。和同事们一起定了外卖。
下午,一件麻烦的工作搞得你快疯了,写了25封邮件打了18个电话发了200条微信,终于在临下班时解决了问题。外面雨过天晴,决定去爽一下。约起朋友,用点评网团购了餐券,顺便在手机上买了两张电影票。
电影不错,有一段配乐特别好听。回家路上,你打开音乐软件,找到了这段音乐,随后它又根据偏好推送了其他音乐。边听边刷微信,发现差点忘了正在追的韩剧今晚更新!昨天专门为此买了视频网站的会员,到家后赶紧追两集,心满意足,准备洗洗睡。牙膏快用完了,躺在床上用手机下单买,顺便买了洗发水零食。
完美的一天。
▲ ? fixatgt.com
我们活在网络世界里。
每一家互联网公司和电信运营商都宣称要“连接人与XX”“连接一切”。电脑、手机、智能电视,覆盖衣食住行的互联网应用,让人每时每刻的一举一动,都通过划一划屏幕,点一点鼠标,置于信息世界的天网中。
行动轨迹、购物习惯、社交行为、兴趣爱好、财务状况、言论内容……关于你的一切,都化为数据,存放在那些互联网公司和运营商的服务器上,拼成了一个信息化的人。
你鄙视《XX的后裔》,追《XX屋》或者《XX的游戏》?随便你。在信息的世界里,这些是平等的,鄙视链并无意义,一切不过是由0和1组成的数据而已。
科幻电影描述的景象就在眼前,我们已被包围,并乐在其中。
▌数据爆炸
数据的最小单位是字节(Byte),一个字母那么大。单位演进是这样的:
1B(Byte字节);
1KB = 2^10 B = 1024 B;
1MB = 1024 KB = 2^20 B;
1GB = 1024 MB = 2^30 B;
1TB = 1024 GB = 2^40 B;
1PB = 1024 TB = 2^50 B;
1EB = 1024 PB = 2^60 B;
1ZB = 1024 EB = 2^70 B;
1YB = 1024 ZB = 2^80 B;
1BB = 1024 YB = 2^90 B;
1NB = 1024 BB = 2^100 B;
1DB = 1024 NB = 2^110 B;
1CB = 1024 DB = 2^120 B;
1XB = 1024 CB = 2^130 B;
……
十年前,个人电脑的硬盘大约是120GB,现在可能是1TB。而目前人类的数据量已经进入ZB时代。
国际数据公司(IDC)的报告称,2013全球数据量为4.4ZB,增长速度在每年40%左右。若以此计算,到2020年将超过45ZB。
未必会这样均匀加速。全球网络指数机构(GWI)的调查显示,拥有智能手机的人数占全球总人数的近80%。智能家居市场已兴起,每样家电恨不能都要集成在一个手机应用上操控,这意味着它们的日常使用数据统统进入了互联网。他们还想把汽车联起来。互联网公司争造无人车,各车企也在谋划物联汽车战略。有机构预测,到2020年,超过20%的汽车将联网,2025年车联网实现全面覆盖。估计未来每辆汽车都是一个移动的智能设备,万物互联指日可待。
▲ 美剧《硅谷》里,智能冰箱们已经实现了“万物互联”,极客甚至借用冰箱里的电脑处理器作为算力基础。 ? Silicon Valley
上面的数据单位表也会越来越长。
目前最大的单位XB有多大?有人算过,假设你有个1XB的移动硬盘,装满MP3,每首10MB大小,大约可以装100,000,000,000,000,000首歌。如果每首歌播放要3分钟,你可以连续听570,776,255,707年。地球已经存在了48亿年,但不及这个时间的1/100。
互联网就像人体的神经网络,连接每个细胞,无处不在。生成的巨量数据,存储在数据中心的超级服务器上。数据中心就像人的大脑,存储,计算,发出信息,一刻不停运转。
▌高耗能的“大脑”
我们所在的这个互联网世界正是构建在这些数据中心之上。根据Gatner的数据,2010年全球已有339万个数据中心。IDC还曾预测,2017年这一数字将达到860万。
Synergy Research将“超大规模数据中心”定义为“拥有几十万台服务器——有时甚至是数百万台”,按此标准,到2017年,全球已有390个这样的庞然大物,仅一年时间就新建了近一百座。百度在山西阳泉的数据中心的建筑面积超过12万平方米,早在2014年就投入使用。阿里在江苏南通投资180亿元建数据中心之后,又在印度孟买、印尼雅加达开拓新的巨型节点。
为了互联网世界的流畅高速运转,这些数据中心日夜不息,多重备份,应急保障,把自己搞得发烫。为了降温,需要大量的制冷设备。装满服务器、控电设备和制冷设备的数据中心,是超级电老虎。
▲ 一处数据中心。 ? ubc.ca
一个大型数据中心的用电量,相当于一个中小型发电厂,可供一个小镇的家庭照明。谷歌在全球有36个数据中心,微软官方称有100个以上,服务器总量超过100万台。掌管着宽带的电信运营商是互联网的枢纽,更是数据中心大户,中国联通目前的数据中心也可承载百万台服务器,遍布31个省。
而这样规模庞大的数据中心,其运算能力是为峰值而准备。传统服务器的利用率很低,据估计80%以上的计算能力闲置。例如阿里和各大银行的服务器,只有“双十一”才会全速运转,平时则大量用于备份数据等保障工作。还有一些老旧服务器本身效率低下。我们使用的云服务,可能就来自这些闲置机器。
▲ 谷歌工作人员正在为服务器更换主板。
制造了互联网世界的巨头很少披露数据中心的具体规模和能耗,他们以高科技、轻资产、无污染的形象面对公众。其实这些大型数据中心耗费巨量电能、产生大量的温室气体排放,消耗大量的水资源以及设备废弃后造成的污染,都给资源和环境带来了巨大挑战。
这一问题已引发各国关注。美国政府实施了“数据中心能源之星”“联邦数据中心整合计划”,欧盟实施了“数据中心能效行为准则”,国际绿色网格组织开展了数据中心节能标准制定和最佳实践推广,引导数据中心节能环保水平的提升。各数据大户的企业巨头们也已开始行动。
▌冷却
在数据中心的能耗中,约有一半是用于制冷。24小时*365天和服务器一起工作的空调系统,使能耗居高不下。除了对系统进行优化改造,数据大户们也想了各种办法冷却“大脑”。
▲ 谷歌位于芬兰的数据中心。
有些公司选择在北欧建立数据中心,因为更凉快。瑞典、芬兰、丹麦都是好地方。Facebook在瑞典的中心位于北极圈附近,可以引入干净的外部空气冷却,当地的水电也很便宜。冰岛也希望将自己打造成数据中心的首选地——这个国家的电力几乎100%来自可再生能源,包括地热能和水力发电。
还有些公司近水楼台。阿里云位于浙江千岛湖的数据中心于2015年启用,采用湖水制冷。深层湖水通过密闭的管道流经数据中心,帮助服务器降温,再流经2.5公里的青溪新城中轴溪,作为城市景观呈现,自然冷却后再回到千岛湖。这让数据中心90%的时间都不依赖外部能源制冷,能耗节省超过8成。微软正在尝试将服务器放进防水的钢铁胶囊容器中,再置于海洋中。但此类工程建设和运营对水环境的影响,则不得而知。
▲ 阿里巴巴冷却机房。
越来越多的数据中心倾向于使用可再生能源,从而减少环境影响。在互联网最兴盛的两个国家——中国和美国,风能和太阳能是主力。Google几年前宣称,已经通过使用可再生能源和购买碳汇,实现了零排放。
▌提升
但上述这些只是极少数。受限于地理位置、电力供给、城市配套设施、运营成本和安全等因素,绝大多数的数据中心难以选择需要高投入的节能方案。我们每天点击鼠标、交流信息、备份文件,都在向这些庞大的机器提出需求,共同消耗着能源。数据中心的能源使用效率仍需整体大幅提升,尤其在中国。
数据中心的能效利用主要通过PUE值来表示,它是数据中心消耗的所有能源(包括电力转化消耗、制冷、备用电池的持续充电等非有效能耗在内)与IT负载使用的能源(有效能耗)之比。PUE值越接近于1,表示一个数据中心的绿色化程度越高。
目前,美国数据中心平均电能使用效率为1.9,谷歌、微软等大型用户的最先进数据中心的电能使用效率据称可低于1.3。反观中国,这一指标平均值在2.0-2.5,政务类数据中心的数据普遍高于2.5,还有大量电能使用效率高于3的数据中心。
研究表明,单是应用现有节能技术,便可分别使我国的数据中心IT设备系统、空调系统、配电系统平均实现节能25%、36%和18%,从而使数据中心整体水平实现节能35%。2011年,全国数据中心总耗电量达700亿千瓦时,若真能实现35%的节能,也将节省全社会用电量的0.53%。
国家也已出台相关政策意见部署数据中心工作,并建立相关绿色标准。2015年,工业和信息化部、国家机关事务管理局、国家能源局三部委联合印发《国家绿色数据中心试点工作方案的通知》,推动绿色数据中心发展。
▌信息也要断舍离
数据中心的绿化之路虽有政府的推进、企业的投入,仍任重道远。昼夜不停流转的信息背后需要大量能源的支撑。于我们每个人而言,所能贡献的,是对信息的“断舍离”。
随手拍的一万张照片,是否都要保留?修改了几十个版本的方案,每一版都舍不得删?看过的影视剧,真的还会再看?过期的垃圾邮件多少年没清理过?电脑硬盘和U盘都有储存上限,用太久存太多会导致运转速度变慢、电脑发烫,遑论上亿人不断往数据中心上载的数据。
虚拟空间并非无限大,数据信息虽无形,却需要消耗实实在在的存储空间和能源,以及生产设备本身的资源能源消耗。互联网的轻、快背后,也有沉重的负担。断舍离,可以为它减一点负。
Gmail邮箱会定期自动删除旧垃圾邮件。腾讯邮箱曾经发起“最亮的明天——暖灯行动”,鼓励用户清理不再需要的旧邮件。当参与的用户删除邮件总量达到150T时,腾讯公益捐赠40万元人民币,用于贫困地区的学校改善照明环境。网络空间对用户来说遥远而模糊,互联网公司加以引导,不失为上选。当然,即便没有捐赠的激励,每个人随手删减内存,每个机构定期清理服务器,也是节约能耗的绿色之举。
▌“众筹”数据中心
还有一种更加神奇的方式,可以将闲置效能用起来,即“众筹”数据中心。
2016年2月,科学家宣布探测到引力波,举国刷屏。中国科学家胡一鸣撰写科普文章,并倡导:用你的电脑,一样可以为引力波的搜索做贡献!由于探测和搜索需要大量的计算资源,所以常年征集志愿者贡献CPU时间,下载一个程序,就可以用电脑闲时的空余CPU,帮助处理来自科学组织的数据。NASA、伯克利大学、斯坦福大学,都倡导过此类行动。
这种“众筹”由于运算技术和效率上的欠缺,没有成熟广泛的应用,一些科研项目由于经费缺乏,但运算指令明确、容易分解,所以有所尝试。有趣的是,项目集中在最宏大的天体物理和最微观的生物医学领域,例如寻找外星人和蛋白质研究,它们本身看起来就像万物互联一样有未来感。
这些未来,已在眼前,我们最好有所了解。
因为了解,我们不期盼未来或在某个机箱轰鸣的夜里,苍穹之下,一片寂寥,群星闭上了眼睛。
*部分数据来源:《中国数据中心能效研究报告》