计算机科学杂志
好友分享
  • 主管单位:国家科学技术部
  • 主办单位:国家科技部西南信息中心
  • 影响因子:0.94
  • 下单时间: 1-3个月
  • 国际刊号:1002-137X
  • 国内刊号:50-1075/TP
  • 全年订价:¥ 1000.00
  • 起订时间:
  • 创刊:1974年
  • 曾用名:计算机应用与应用数学
  • 周期:月刊
  • 出版社:计算机科学
  • 发行:重庆
  • 语言:中文
  • 主编:朱宗元
  • 邮发:78-68
  • 库存:187
  • 邮编:401121
投稿咨询 免费咨询 杂志订阅
相关期刊
服务介绍

计算机科学 2015年第11期杂志 文档列表

计算机科学杂志2014年全国高性能计算学术年会
内存列存储数据库中优化的混合自适应索引 作者:薛忠斌 周烜 张延松 周新 王珊 单位:教育部数据工程与知识工程重点实验室中国人民大学 北京100872 中国人民大学信息学院 北京100872
28-31

摘要:分析型数据库在现代企业中得到广泛应用,在使用过程中对查询处理速度的要求逐渐提高.大数据环境下,分析型数据库面临一系列新的挑战:首先,数据复杂性与日俱增,使得数据库系统的初始配置任务更加繁重,例如索引创建等;其次,在分析过程中,由于查询负载模式无法预知,需要对某些属性反复构建索引,以满足查询的时间要求.显然,传统的索引构建维护技术不能完全满足新的应用环境.数据库分裂技术提出了一种不同的策略去解决这些问题.使用数据库分裂技术,DBA不需要对数据库进行细粒度的系统配置.在查询执行过程中,数据库能自动调整以适应查询负载;随着查询负载的变化,系统自动调整索引.近年来,一系列数据库分裂算法被提出,但已有的算法都各有优缺点.因此给出了一个cache conscious的数据库分裂代价模型,并基于该模型构建了一个新的自适应索引,其可以综合不同数据库分裂算法的优势.通过大量实验验证了这种新自适应索引技术的有效性.

基于OpenCL的直方图生成算法优化方法研究 作者:安小景 张云泉 贾海鹏 单位:中国科学院计算技术研究所体系结构国家重点实验室 北京100190
32-36

摘要:随着GPU计算能力及可编程性的不断增强,采用GPU作为通用加速器对应用程序进行性能加速已经成为提升程序性能的主要模式.直方图生成算法是计算机视觉的常用算法,在图像处理、模式识别、图像搜索等领域都有着广泛的应用.随着图像处理规模的扩大和实时性要求的提高,通过GPU提升直方图生成算法性能的需求也越来越强.在GPU计算平台关键优化方法和技术的基础上,完成了直方图生成算法在GPU计算平台上的实现及优化.实验结果表明,通过使用直方图备份、访存优化、数据本地化及规约优化等优化方法,直方图生成算法在AMD HD7850 GPU计算平台上的性能相对于优化前的版本达到了1.8~13.3倍的提升;相对于CPU版本,在不同数据规模下也达到了7.2~210.8倍的性能提升.

Intel Knights Corner的结点级内存访问优化 作者:林新华 李硕 赵嘉明 松岗聪 单位:上海交通大学高性能计算中心 上海200240 东京工业大学学术国际情报中心 东京152-8550 Intel公司软件与服务部门 波特兰999039
37-42

摘要:传统编程优化(Traditional Programming Optimization,TPO)在Intel Knights Corner (KNC)上收效甚微,因此提出内存访问优化(Memory Access Optimization,MAO).将MAO应用到已经过TPO的程序Diffusion 3D上,发现其性能仍然提高了39.1%.主要有2个贡献:1)提出MAO,认为TPO+MAO有助于在KNC上获取最优化性能;2)发现对于stencil代码,基于intrinsic的MAO比基于编译器的MAO更高效.这些发现对于在KNC上优化大规模应用有启发意义.

基于异构多核平台的同步数据流图帕累托优化与调度 作者:顾玉磊 朱雪阳 晏荣杰 张广泉 单位:苏州大学计算机科学与技术学院 苏州215006 中国科学院软件研究所计算机科学国家重点实验室 北京100190
43-47

摘要:同步数据流图被广泛用于多媒体和数字信号处理程序等流应用程序的建模。流应用程序须达到一定吞吐量才能流畅运行,利用异构多核处理器来进一步提高流应用程序的吞吐量已经成为当今嵌入式系统的发展趋势,但是提高吞吐量往往伴随着能耗的增加。为了解决这个问题,基于异构多核平台的同步数据流图系统模型,给出了求解所有能耗和吞吐量的帕累托优化点及其相应静态调度的方法。首先将系统模型转换为时间自动机网络,并将分析目标转换为时序逻辑公式;再使用实时模型检测工具UPPAAL寻找解决方案;最后对UPPAAL返回的结果进行分析,找出满足要求的调度。由于模型检测方法可对问题空间进行穷尽搜索,该方法得到的结果是精确的。该方法可帮助设计者在系统开发早期了解系统能耗和吞吐量的量化关系,有利于缩短系统的开发周期,降低开发成本。

大数据负载的体系结构特征分析 作者:罗建平 谢梦瑶 王华锋 单位:中国科学院计算技术研究所先进计算机系统研究中心 北京100190 北京航空航天大学软件学院 北京100091 郑州大学信息工程学院 郑州450001
48-52

摘要:针对大数据离线分析类和交互式查询类负载,首先对这些负载的一些共性进行分析,提取出公共操作集,并对它们进行分组整理;然后在大数据平台上测试这些负载运行过程中的微体系结构特征,采用PCA和SimpleKMeans算法对这些体系结构特征参数进行降维和聚类处理。实验分析结果表明负载之间有公共的操作集,如Join和Cross Production;有些负载有相似的属性,如Difference和Proiection共享相同的微体系结构特征。实验结果对于处理器等硬件平台的设计以及应用程序的优化具有指导性的意义,并且为大数据基准测试平台的设计提供了参考。

互相关运算在银河飞腾DSP上的实现及优化 作者:杨琳 吴家铸 扈啸 田希 单位:国防科学技术大学计算机学院 长沙410073
53-55

摘要:在信号处理领域中,互相关运算对于寻找未知信号中的特性具有重要的作用.互相关常被用于图像匹配、粒子图像测速等领域.针对互相关运算计算量大而实时系统中要求较快运算速度的问题,利用银河飞腾多核DSP(YH-FT-QDSP)的FFT加速器完成二维FFT运算,在YHFT-QDSP上实现了互相关运算,从而提高了互相关运算在实时系统中的性能,并在此基础上针对输入数据大小的不同提出了若干优化的方法,进一步提高了互相关运算的性能.

有限元网格积分算法在MIC众核平台上的并行实现 作者:寇大治 孔大力 单位:上海超级计算中心 上海201203 埃克塞特大学数学系 埃克塞特EX44QF
56-58

摘要:基于英特尔集成众核(Many Integrated Core,MIC)架构,将有限元网格积分算法在至强融核(Xeon Phi)协处理器做了移植和性能分析.该应用全面测试了有限元分析的核心计算过程在MIC上的加速效果,实现了卸载模式(off load)[1]下利用OpenMP在MIC上的线程并行化.计算性能测试结果显示集成众核平台可以有效地加速有限元网格积分算法:1)一块被充分利用的MIC设备卡(3115A)的计算能力超过两路16核Intel XeonTM E5-2670 CPU;2)MIC并发的物理线程可能由于公共缓存访问存在竞争而降低程序的扩展性.测试结果还显示了在多CPU多MIC平台上进一步移植完整的MPI并行有限元模拟软件的可行性.这项工作有助于推动与有限元网格相关的科学和工程高性能计算的研究.

OpenFlow网络数据流路径建立开销的量化分析 作者:吴洁 付斌章 陈明宇 张立新 单位:中国科学院计算技术研究所先进计算机系统研究中心 北京100190 中国科学院大学 北京100190
59-62

摘要:OpenFlow采用数据平面与控制平面分离的架构,以软件实现的OpenFlow控制器作为控制平面对网络进行集中控制.在这种分离架构中,由于交换机需要与控制器进行交互,因此必然会产生一定的时间开销.经实验,数据流建立过程中的信息交互导致数据包传输时延至少增长2倍,严重降低了网络性能.因此,量化分析OpenFlow网络中流建立开销具有重要意义.分析流建立开销产生的原因,对导致数据包传输时延增长的影响因素进行量化分析.评估流建立开销对网络性能的影响是量化分析数据流路径建立开销的重点.

面向定制结构的稀疏矩阵分块方法 作者:邬贵明 王淼 谢向辉 窦勇 郭松 单位:国防科学技术大学计算机学院 长沙410073 数学工程与先进计算国家重点实验室 无锡214125
63-64

摘要:稀疏矩阵向量乘是科学计算的核心问题,采用定制结构来加速稀疏矩阵向量乘的执行对提升科学计算性能具有重要意义.针对目前面向定制结构的稀疏矩阵分块方法和表示方法的缺点,提出了稀疏矩阵二维均匀分块方法和相应的表示方法嵌套分块CSR.实验结果表明,提出的稀疏矩阵分块方法和表示方法能够有效减少填零个数.

基于树型结构的MapReduce并行模型 作者:唐兵 贺海武 单位:湖南科技大学计算机科学与工程学院 湘潭411201 中国科学院计算机网络信息中心 北京100190
65-67

摘要:MapReduce是Google提出的一种分布式计算模型,已在海量数据处理领域得到了广泛的应用.提出一种基于树型结构的新型MapReduce并行模型.该模型适合于利用Internet或Intranet环境下不可靠的桌面PC资源进行海量科学数据分析.该模型以P2P的形式将计算节点进行组织,模型的底层采用了P2P-MPI框架,采用基于消息传递的模式来实现MapReduce应用层.在MapReduce应用层的实现中,在Map阶段采用广播的形式来分发数据块,在Reduce阶段建立反向二叉树来实现有效的结果合并和化简.将提出的MapReduce模型与现有主流MapReduce模型进行了比较,结果表明,基于树型结构的MapReduce并行模型在容错性能方面具有较优的性能,且系统简单,易于应用开发.

一种基于主动认知决策的高效能模型 作者:杨劲 庞建民 王俊超 于锦涛 刘睿 单位:解放军信息工程大学 郑州450001 数学工程与先进计算国家重点实验室 郑州450001 解放军61345部队 西安710100
68-72

摘要:随着高性能计算机的发展,如何降低功耗、提高计算机的效能,越来越受到人们的关注.针对高性能计算机的效能问题,采用可重构思想,提出一种基于主动认知决策的高效能模型.该模型不断感知应用任务的实时状态,并对应用状态和当前应用结构做出评估决策,通过主动重构应用结构来达到降低系统能耗和提高效能的目的.为了验证模型的有效性,搭建了原型实验系统,实现了视频拷贝检测和口令恢复两个应用,并采用真实的互联网流量统计曲线模拟负荷.结果表明,基于该模型构建的应用能够提高系统的效能,在上述环境下,与传统方法相比,效能提高了58%.

一种基于云端信息保护的汉字计算模型 作者:栗青生 张莉 刘泉 熊晶 杨新新 单位:武汉理工大学信息工程学院 武汉430070 湖北经济学院工商管理学院 武汉430205 安阳师范学院计算机与信息工程学院 安阳455000
73-79

摘要:提出了一种基于信息内容保护的信息安全模型.该模型利用将汉字笔画抽象为有向图的方法,设计了汉字笔画图抽象的具体方案,实现了对汉字字形结构的动态描述;建立了动态汉字字形描述库,设计了汉字字形的生成算法,实现了汉字字形的Web存储和特征字形的客户端输出.所提模型为汉字信息的云端存储和云端数据安全性保护提供了一种解决方案,不仅有助于汉字信息的安全保护,而且有助于汉字认知计算、语义计算等深度汉字信息计算.

基于MapReduce的MIC算法并行化 作者:吕瑞 蔡国永 裴广战 单位:桂林电子科技大学广西可信软件重点实验室 桂林541004
80-83

摘要:MIC是一种分析变量之间可能存在的关系的方法.该方法不仅能够有效识别出变量间各种复杂类型的关系,还能够准确描述噪音数据对存在关系的影响,对探索大数据集中变量之间的关系具有重要意义.针对该方法在处理包含大量变量的数据集时性能方面的不足,首次对它进行了基于MapReduce模型的并行化.提出的并行化方法首先对原算法进行更细颗粒度的划分,然后采用一种基于Map-Reduce-Map任务链的并行模型,该模型不仅有效地增加了并行的计算单元,还大大地降低了不必要的系统开销.最后,通过理论分析和实验验证得出,改进后的算法与原算法相比,在准确率方面具有等效性,运行速度大幅度提升且具有良好的可扩展性;实验同时指出了算法性能的提升与系统资源的关系.

面向Java锁机制的字节码自动重构框架 作者:张杨 张冬雯 仇晶 单位:河北科技大学信息科学与工程学院 石家庄050000
84-89

摘要:Java语言提供了同步锁、可重入锁和读写锁等几种锁机制,在并行程序设计中不同的数据结构使用这几种锁机制时获得的性能通常是不同的.为了在不同的锁机制之间进行自动转换,进而帮助程序员了解程序的性能,提出了一种面向Java锁机制的字节码自动重构框架,并基于该框架实现了字节码重构工具Lock2Lock.Lock2Lock在Quad中间表示的基础上对字节码进行静态分析,并对分析的结果进行一致性验证,通过Javassist完成字节码的重构.使用红黑树、消费者生产者程序以及SPECjbb2005 3个测试程序对Lock2Lock重构工具进行了测试,结果表明,Lock2Lock可以成功地实现从同步锁到可重入锁或读写锁的重构.

基于GPU并行加速的多特征融合的超图降维方法 作者:洪朝群 陈旭辉 王晓栋 李士锦 吴克寿 单位:厦门理工学院计算机与信息工程学院 厦门361024
90-93

摘要:基于图的学习方法目前广泛用于降低特征维度.然而,对于多特征数据而言,不同特征之间的不同关联性很难结合到单个图中.针对多特征数据提出了新的半监督降维方法.首先,以超图中的超边作为片,使超图应用到片对齐框架中.然后,通过统计片中相邻的特征对的距离计算超边的权重,使得不同特征下的片得到结合.其次,由于欧氏距离和矩阵乘法的计算在拉普拉斯矩阵的构造过程中占用了大部分的时间,因此使用GPU对其进行加速.实验结果表明了所提方法在分类性能和学习速度上的提升效果.