新訊

NVIDIA TITAN V 在科學模擬計算中結果可能不可靠

目前 NVIDIA TITAN V 是市售中最強的顯卡,不過它的售價以及架構都說明了它不只可用於打遊戲,也是一張算是半專業的運算卡,不少研究機構、實驗室都會用它於科學運算,但最近有一些工程師反映,TITAN V 在某些特定情況下的科學模擬計算中無法給出可靠的答案,懷疑是記憶體不支援 ECC 糾錯造成的。



nvidia_titan_v_1.jpg

TITAN V 的規格強悍,史無前例的80組SM單元,5120個CUDA單元,211億個晶體管。新加入的專門用於深度計算Tensor單元,注定 TITAN V 就不是一張普通的遊戲卡。

因此很多科學家都用它來跑科學模擬運算,但有些科學家卻發現 TITAN V 處理出來的結果似乎不太可靠,比方說用四張 TITAN V 顯卡來處理蛋白質與酶之間合成計算,在相同的測試參數下,每一次的測試結果都應該是相同的,但實際上跑出來的結果卻不一樣。

而一位不願意透露姓名的資深業內人士表示,這很可能是 NVIDIA TITAN V 顯卡的記憶體出現了溢出錯誤導致的,因為 NVIDIA TITAN系 列顯卡中全面禁用了 ECC 糾錯功能,在處理像科學計算超龐大體量數據時,沒有糾錯功能下,記憶體很可能會來不及處理部分數據進而導致溢出,最後運算結果自然是不相同的,目前已確認一款稱為 Amber 的分子動力學科學應用程序受到影響。

目前 NVIDIA 對這件事情表態,“All of our GPUs add correctly. Our Tesla line, which has ECC [error-correcting code memory], is designed for these types of large scale, high performance simulations. Anyone who does experience issues should contact support@nvidia.com.”言外之意就是,“首先遇到問題請馬上聯繫我們,另外你們這些科學家應該用更加專業更加昂貴的 Tesla 顯卡,因為它們都是帶有 ECC 糾錯功能的”。

來源:http://www.expreview.com/60182.html

fox-jojoman

謝謝你們~
已加入
8/13/07
訊息
661
互動分數
3
點數
18
哈哈哈~搞專業的錢不要省呀
 

blackleo

一般般會員
已加入
10/8/03
訊息
145
互動分數
5
點數
18

NEAL

一般般會員
已加入
6/22/05
訊息
53
互動分數
2
點數
8
這樣說的話,Titan V本質還是一張有運算力的電玩卡。
 

cisco2012

榮譽會員
已加入
7/20/10
訊息
1,000
互動分數
14
點數
38
自己破解可以ecc的話--這樣的科學家~~才是有夠強~~
 

Saxen

一般般會員
已加入
5/9/07
訊息
50
互動分數
5
點數
8
都懷疑是ECC的問題,那還用沒ECC的卡來跑,我也是服了
 
▌延伸閱讀