海量计算走近你我他
□雅 江

  海量计算带来了什么?
  众所周知,超级计算机过去曾主要用于流体力学和地理勘测等领域的科学计算。但在不远的将来,一个崭新的多线程编程时代将改变一切,大量的消费类应用软件都能够充分发挥多核处理器的计算能力。诸如高清娱乐、人工智能、即时视频通讯、多媒体游戏等应用,将在亿万级计算处理器的帮助下蓬勃发展。未来的PC甚至可以通过人的唇形来读取用户语音,并大幅改进语音识别的精确度。
  有鉴于此,万亿级计算将是一场在计算能力和创新数量上的双重革命。“万亿级”这一术语本身是指必须由具有万亿次浮点计算性能的平台来处理的万亿字节数据。其计算能力是当今千兆级设备的1000倍。
  在计算领域,人类为何要实现如此巨大的飞跃?这是因为目前的计算机无法支持跨万亿次浮点运算的实时数据挖掘、面向汽车和设备的人工智能以及虚拟现实等其他超前应用。
  此外,众所周知,全球的运算存储量正在不断增加且日趋复杂。在医学领域,一次全身医疗扫描便已包含了万亿字节的信息。即便是在家中,人们也会产生大量数据,包括数百小时的视频、数千份文件乃至数万张数码照片,而这些都需要编入索引和进行搜索。因此万亿级计算是将超级计算机的大规模计算能力推广到日常设备(从服务器、台式机到笔记本电脑)上的理想途径。
  例如,借助万亿级计算机,人们可以实时创建照片级三维图像,还可以通过对照片和家庭视频进行自动分析、标记和归类,更好地管理个人媒体。而老式低分辨率摄像机所拍摄的影像质量,也可利用高级算法获得改善。高级数字医疗应用可通过分析扫描所获得的大量数据,评估患者的健康状况,以辅助医生实时制定决策。万亿级技术的本质,就是通过并行执行多项任务,实时处理复杂的计算问题。
  有关专家预计,未来围绕万亿级架构将会产生使用数十个甚至数百个内核的计算设备,以并行的方式处理大量信息。届时,更加引人入胜、充满互动乐趣的实时应用将触手可及。
  在万亿级计算世界中,将会产生多种全新的处理能力,用于挖掘和解释全球不断增长的数据,并以更高效的方式完成此项任务。例如,智能代理将在第一时间就股票交易和其他财务决策为用户提供建议。这种代理能够对浩如烟海的数字视频资源进行搜索,找到特定的人或事件,甚至能够根据用户期望看到的内容,编辑完成一个新的视频。
  对游戏玩家而言,他们将能够体验到拟真度极高的图像质量所带来的震撼效果。然而,这些优势并不是只有游戏玩家才能享受到。现在,人们正在开发用于协作和教育领域的交互式虚拟环境,例如通过与虚拟的讲母语的人进行互动来学习语言,或是在模拟的人体上教医生处理紧急情况。
  厂商发力
  海量计算触手可得
  鉴于海量计算的光明前景,英特尔公司如今已开发出一款崭新的原型芯片,将80个简化的浮点运算核心(相当于电子大脑)整合在单一芯片中。这是横扫半导体行业的设计变革的最新标志。据记者了解,目前,英特尔这款新型芯片还只是一个研究项目,而非一款实际产品。这种集成了80个微处理器的芯片专门用于“浮点”运算。在测试中,该芯片的运算速度超过了teraflop级(即每秒可完成一万亿次浮点运算),而耗电量仅为62瓦。与此形成鲜明对比的是,英特尔在1996年打造出的首个teraflop等级超级电脑,需占地2000平方英尺,耗电量为50万瓦。
  据介绍,英特尔如今正在对其处理万亿级工作负载所需的能力进行分类研究。这些处理能力可以分为三种基本类型:识别(Recognition)、挖掘(Mining)与合成(Synthesis),统称为RMS。
  “识别”指的是计算机检查数据和图像,并据此构建数学模型的机器学习能力,例如某个具体人脸的模型。挖掘是在大量现实生活数据中发现特定模型样例的能力,例如从多种分辨率、照明环境的图像中找到某个具体的人脸。合成则是指通过构建新的模型样例,探索理论场景的能力。比如,如果某个人更年轻或更老,他的模样会有什么变化。
  专家指出,RMS应用模型具有通用性,因此可以满足高性能计算、数字内容创制、计算机视觉和人工智能等领域的海量计算需求。但是,这些应用对系统的微体系架构技术、互联技术、内存技术以及软件开发技术都提出了很高的要求。这其中,如何高效地编写出可发挥多核处理器优势的软件,是万亿级计算时代所面临的最严峻挑战之一。
  据透露,英特尔未来将致力于构建内含数十个乃至数百个内核的处理器,它们有望在5到10年内问世。届时,不仅一台普通PC甚至连一部手机上都可能内置一块80核心的英特尔处理器。
  与此同时,作为英特尔的竞争对手,AMD前不久也展示了一个突破万亿次浮点计算障碍的单系统加速计算(AcceleratedComputing)平台。众多机构都非常期待能够将此项技术广泛应用于科学、医药、商业和消费类等计算应用。它可以运行标准版的MicrosoftWindowsXPProfessional,利用AMD双核皓龙处理器技术和两个新一代AMDR600流处理器的超强性能,实现每秒1万亿次以上的浮点计算。相对于目前每秒能执行约千亿次浮点计算的高性能服务器平台,这一成就将为AMD的处理器产品带来高达10倍的性能增长。
  其他公司如今也正在探索同样的设计理念,将几个乃至几百个微处理器整合在一块芯片上,作为计算机的运算引擎。这类创新产品目前只承担特定的任务以及一些科学试验,不过业内专家相信,它最终将扩展至各种消费类电子产品领域,让我们的数字生活变得更加多姿多彩。

  
 
 
 
 
 
 
版权所有 中国民航报 未经书面授权,不得转抄