CAS OpenIR
格子Boltzmann方法多GPU并行性能的研究
张纲; 王利民; 葛蔚
2017
Source Publication计算机与应用化学
Volume34Issue:10Pages:739-748
Abstract

基于CUDA和MPI实现了格子Boltzmann方法的多GPU并行计算,利用程序对Tesla K80和Tesla P100的性能进行了测试,结果表明:Tesla P100有着远超Tesla K80的计算性能。单GPU下,P100在计算规模为2563达到最大值2880.0 MLUPS,K80在规模为384~3达到最大值801.6 MLUPS;在多GPU并行时,GPU间通信会带来计算性能的损失,但是P100较K80仍具有较大的提升;测定函数LBCollProp在不同规模下运行时间以及其在程序总运行时间中的占比,由此可以预估程序运行一定时间步的耗时。

Keyword格子boltzmann方法 Tesla P100 性能
Language中文
Document Type期刊论文
Identifierhttp://ir.ipe.ac.cn/handle/122111/25166
Collection中国科学院过程工程研究所
Affiliation1.中国科学院过程工程研究所多相复杂系统国家重点实验室
2.中国科学院大学
Recommended Citation
GB/T 7714
张纲,王利民,葛蔚. 格子Boltzmann方法多GPU并行性能的研究[J]. 计算机与应用化学,2017,34(10):739-748.
APA 张纲,王利民,&葛蔚.(2017).格子Boltzmann方法多GPU并行性能的研究.计算机与应用化学,34(10),739-748.
MLA 张纲,et al."格子Boltzmann方法多GPU并行性能的研究".计算机与应用化学 34.10(2017):739-748.
Files in This Item:
File Name/Size DocType Version Access License
格子Boltzmann方法多GPU并行性(1082KB)期刊论文出版稿限制开放CC BY-NC-SAApplication Full Text
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[张纲]'s Articles
[王利民]'s Articles
[葛蔚]'s Articles
Baidu academic
Similar articles in Baidu academic
[张纲]'s Articles
[王利民]'s Articles
[葛蔚]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[张纲]'s Articles
[王利民]'s Articles
[葛蔚]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.