一张不玩游戏的信仰卡:EVGA GTX 1070 FOUNDERS EDITION开箱
引言
为什么说这是一张不玩游戏的显卡呢,客观来说,游戏只是当今显卡多种用途中非常普通的一种,随着显卡技术的发展,现在的显卡拥有数以千计的核心,可高效地处理并行任务,在科研,设计,数据挖掘及深度学习等领域里有了越来越广泛的应用。而且相比cpu来说,用gpu进行并行计算有超高的性价比,就我所接触的分子动力学模拟来说,一张gtx 1080的计算能力可以达到一个Intel E5-2650的20倍(cf.链接)。对了,本篇介绍的显卡就是用来跑分子动力模拟的。
分子动力学
简单介绍一下分子动力学和其计算的特殊性。分子动力学是通过对分子、原子在一定时间内运动状态的模拟,从而以动态观点考察系统随时间演化的行为。通常来说,原子,分子或者分子团的运动轨迹是牛顿方程的数值解,嗯,这个初中物理就学过,F=ma。 在不考虑量子效应的情况下,分子动力学模拟就可以想象成不断的求解粒子间作用的牛顿方程,由于方程形式简单,也就暗示了对于单个粒子在一定计算步长里的计算并不复杂,对于“高智商”的cpu来说显然是杀鸡用牛刀。但想象如果让人不断的做100以内加减法,再聪明的人也算不过几台简单的计算器。同理,cpu虽然聪明,但对于这种重复的简单计算,其效率也不会太高,于是人们意识到用具有很多“核”的显卡来进行这种重复简单计算是一个不错的选择。而老黄显然在很多年前就看准了这个市场,cuda集成技术已经到了第八代并迅速在分子动力学领域得到了很大的应用,反观农企推出自家HCC异构计算编译器的时候已经很晚了,几乎没有哪个分子动力学软件包对此有支持。由于各软件包对OpenCL的移植都还不算完善(A卡N卡都支持OpenCL),所以分子动力学领域如果要使用gpu加速,N卡是不二选择。
显卡选择
本人接触分子动力模拟时间不太久,使用cg模型模拟磷脂双分子。上微秒的模拟基本要用到学校的cluster,但是样品准备基本都在自己的macbook pro上,对于稍微大点的体系计算时间和发热就有点受不了了。家里台式机是早前从i5-3570K升级到的i7-4790K,16G ddr3 2400内存,显卡还是早前的农企HD7950。现在换门,专业的Tesla和Quadro实在不是我等屌丝承受得起,好在老黄在cuda这点上非常厚道,给了家用卡相同的处理单元(当然,数量不同),所有支持cuda运算的程序在家用卡上也能实现计算加速。
纠结于gtx 1070和gtx 1080好久,说实话1080的计算能力实在让人垂涎欲滴,但欧村的价格也是在高高在上,预计到还有个把月合同到期又要找新工作,经济上不足以支持我毫不犹豫的上1080,于是降级选择了1070。品牌实际上已经早早锁定了evga,主要是3年全球保,鉴于将来工作地点的不稳定以及烧主板的事情不是没有发生过,我对全球保有相当的执著。evga 公版的1070在法国的最低价大概470欧,合人民币3470,ftw版在德国最低价也是这个,同样纠结了一段时间,最终还是选择了公版,只有一个理由,稳定。要更好的性能,我倾向于选择直接升级而不是超频,毕竟机器有价数据和时间无价。何况公版还有信仰呢 ,以后就算要出,或者加一张1070公版组SLI,都是不错的选择。
鉴于京东没有evga公版卖,就贴一个EVGA SC和一个微星的公版吧,价格差不多。
EVGA GTX 1070简单开箱
⬆︎ 外包装非常低调简洁
⬆︎ 内包装也是非常简(jian)洁(lou),一个塑料盒了事,附带电源转接线和说明书,无力吐槽。
⬆︎ 和原来的技嘉三奶7950对比,长度稍微短点,不过itx机箱的话估计也比较困难。
⬆︎ 进机箱,开机信仰灯,其实个人对灯这个东西不太感冒,机箱是老式的antec 302,盖子一合什么都看不到,背线设计什么的也比现在的机箱差了不少,电源rm750,自带的线又粗又硬,而且功率过剩,我这机子的配置如果不上双卡估计一辈子风扇也不会转了。
其他的就不晒了,公版都一样,背板和散热的做工还是很不错的,分量也很足,比三奶7950重不少。
是不是真的加速了
对于这个问题,其实权威的回答要去各种严肃的科技文献中寻找。对我模拟的一个简单体系来说,我所预期的是gtx 1070可以加快一倍到两倍的速度,也就是说计算速度是原来的两到三倍。实际过程中使用gromacs 4和2016两个版本的软件包,由于牵扯到软件支持以及参数设置的问题,有些原来在gromacs 4上使用的参数无法开启显卡加速,所以新老版本的对比不严谨。下图横轴是版本及测试设置,纵轴是计算速度,单位是模拟时间“纳秒”/真实时间“天”。单比较2016版本,gpu提速大概在0.5倍左右,低于预期。不过这只是个不严谨的粗略测试,可能还有参数没有调整到最适合gpu加速,认真比较的话,这个测试(链接)应该靠谱,个人估计gtx 1070的效率大概在980Ti与上代Titan之间。
此外个人关心的问题是温度,网传公版散热各种不给力,实际上在测试过程中,室温20°C左右,待机温度大约33°C,计算过程中保持在48°C左右,但此时显卡并不是满负载,所以也说明程序设置还有问题,没有挖掘显卡的全部潜力。单测cpu的时候8线程都是满载。
总结
总体来说,gpu对科学计算的推动是革命性的,为了愉快的干活而剁手一张中端显卡来说性价比也算很高了(相较于高端cpu),如果想在pc上提高一点模拟速度,相对于高价的gtx 1080和天价的Tesla,gtx 1070是一个对个人不错的选择。当然,如果你还想玩游戏,那就当是显卡附送功能吧 。
神圣干涉
校验提示文案
JeRung
校验提示文案
美雅井洞
校验提示文案
起名真麻烦722
校验提示文案
David_ZHANG
校验提示文案
福星老师
校验提示文案
Atom_Huang
校验提示文案
TK棒棒哒
校验提示文案
Gardenias
校验提示文案
你走开吧
校验提示文案
tanggovernment
校验提示文案
孤星赏月
校验提示文案
nomylord
校验提示文案
兜兜里有麦子
校验提示文案
Scarborough_Fair
校验提示文案
Scarborough_Fair
校验提示文案
兜兜里有麦子
校验提示文案
nomylord
校验提示文案
Atom_Huang
校验提示文案
福星老师
校验提示文案
David_ZHANG
校验提示文案
孤星赏月
校验提示文案
tanggovernment
校验提示文案
你走开吧
校验提示文案
Gardenias
校验提示文案
起名真麻烦722
校验提示文案
TK棒棒哒
校验提示文案
美雅井洞
校验提示文案
JeRung
校验提示文案
神圣干涉
校验提示文案