你滿了,那我就漫出來了!給你滿滿的AMD!!測試篇

atarux

一般般會員
已加入
10/31/09
訊息
57
互動分數
6
點數
8
6336061871_996a5260b4_o.jpg

▲Bulldozer版本AMD Opteron的新商標。
6340674524_6bc4962066_o.jpg

▲32核心和32GB記憶體的魄力!!
還記得在2003年的時候,AMD以K8架構的處理器終於首次有能力去讓強大的對手Intel不得不正視其存在。當時的AMD以處理器內建記憶體控制器、支援64位元指令集以及相對傑出的效能,讓採用NetBurst微架構的Intel受到某種程度的壓力。如今,8年過去了,當Intel從超高時脈和超多層級管線的幻夢中醒來,打造出包含Core、Nehalem和Sandy Bridge等微架構既兼顧了IPC (instructions per clock)效能且擁有可觀的整體運算能量處理器時,AMD還在用以K8微架構延伸出的K10家族苦撐。筆者記憶所及,約在兩三年前參加Computex Taipei時,在會場遇到友人:神達泰安( MiTAC-Tyan)的一位FAE。在聊天之中我對他說:「AMD的處理器要翻身只能看Bulldozer微架構的表現,如果還是不行,那AMD以後要繼續走x86處理器的這條路會非常辛苦!」由此可見AMD在處理器這塊領域自從K8展示曇花一現的崛起(到2006年Intel推出Core微架構的產品後就一路走跌)之後被對手的強大製程和新架構研發能量壓制了多久。
終於,在2011年的後半,AMD總算把Bulldozer微架構的處理器給生了出來。
此回AMD的新微架構建構單元稱之為模塊。一個模塊具備的實體電路和複雜度是妥協後的產物:介於「各個核心為完全獨立的雙核處理器實體」和「具同時雙執行緒能力,而每個執行緒共享大部分的硬體資源之單處理器核心」中間。
6336028339_a7e8e77247_o.jpg

▲Bulldozer相對於競爭對手在架構上的差異示意圖。
基本的模塊是一個30.9 mm²晶片面積,由2.13億電晶體組成,其中擁有兩組整數運算的排程器,一個由兩組128位元FMAC所構成,具備彈性化可合併為256位元的浮點運算單元,和所有單元共用的指令預取(Fetch)/ 解碼(Decode)、第二階快取。Bulldozer模塊中每一個整數運算單元會被作業系統辨認為一個實體核心,CPU一共包含4個模塊,又每個模塊內有2個核心,故共計8個核心、4組2MB第二階快取、4組2MB 第三階快取、4條HT匯流排、DDR3記憶體控制器、北橋模組、輸入輸出裝置等等,以及各四個16-bit,用於發出與接受的HyperTransport匯流排連結,故Bulldozer整體的核心晶片面積高達315 mm²。而伺服器版本的Bulldozer(原廠代號Interlagos)是採取 兩組多晶片模組(MCM)方式來實現16核心的規格並且支援了四個 DDR3-1600 ECC Registered DDR3的記憶體控制器通道。
6336784366_bbb08fc317_o.jpg

▲AMD新一代處理器基本架構的示意圖。
Bulldozer支援的指令集較前身K10可謂強化不少,從Intel的AES、SSE4.1及SSE 4.2,到FMA4、XOP還有CVT16,全部都被列入清單中!並對先進向量擴充指令集AVX達到最大限度相容。
生產製造的方面,除了用上Global Foundries的11金屬層 32奈米SOI(Silicon On Insulator,矽電晶體結構在絕緣體之上)技術外,也首次使用HKMG(高介電率絕緣膜/金屬閥電極)。之所以使用HKMG方式是因為可減少柵極的漏電量,降低柵極電容,如此一來會使電晶體的尺寸更進一步縮減,亦為繼續提高製程之關鍵技術。
匯流排的部分,採用Hyper Transport Technology 3.1版 (3.20 GHz,6.4 GT/s,25.6 GB/s,16-bit uplink/16-bit downlink)。這已經達到Intel QuickPath Interconnect匯流排的書面規格水準,若真能完全發揮這般水準,相信在資料吞吐量的表現上可以更進一步。
6336028653_a7bd56d7eb_o.jpg

▲這是AMD官方所宣示Bulldozer處理器對軟體方面的特點。
本質上,Bulldozer架構是對高時脈最佳化的處理器,所以要讓該架構的處理器能發光發熱便要能以高時脈運作。雖說Intel在NetBurst微架構失敗後業已膽寒,不過,當時Intel的問題並不主要在高時脈本身。更多的問題在於微架構本身的缺陷。君不見在伺服器市場上,IBM以Power 7達到了高時脈高效能的成果!加上AMD的處理器研發團隊中也有前IBM的技術人員,所以AMD想借用Power 7這類伺服器處理器的方式來達成強大的運算能力是可被理解的。
回歸主題,這次美超微(SuperMicro)送測的是最新的Bulldozer架構處理器伺服器用版本—AMD Opteron 6282SE(惡魔黨黨員習慣暱稱為:超微的黑白衝)、可用於伺服器或繪圖工作站的雙G34 (1944針腳)腳位的H8DG6-F主機板和單支容量4GB的Hynix DDR3-1600 ECC Registered記憶體模組。
測試平台的硬體總結如下:
6344721776_83b5546b0b_o.jpg

軟體部分:
6344722900_0e300fd886_o.jpg

本次測試,分為一般家用的Windows 7環境和伺服器級的Windows Server 2008 R2兩個區塊。
之所以會拿來看看家用作業系統的表現,另外一個原因就是因為,約8、9年前,早在AMD推出Athlon MP "Palomino" 核心的時代,國內外的高階玩家就開始有越來越多人是使用雙處理器插槽的工作站/伺服器等級平台兼做一般的個人遊戲用電腦來使用。筆者當時在北市八德路上的玩家天地就見識過了這些「真長輩」是怎樣疼自己或自己的小孩....
首先,我們來看看在Windows 7作業系統下,美超微提供的AMD雙Opteron平台搭配娛樂用3D顯示卡的表現。
6339977973_8aaccf7ec6_o.gif

▲ 這是藍寶科技所提供的公版Radeon HD6970之GPU-Z截圖。
6339962953_1f3a1499db_o.jpg

6340712480_c686c584b5_o.jpg

6339965567_413031f9cd_o.jpg

▲3D Mark Vantage分別在H、P以及X模式下的分數。
6339960553_4d8b2a7b8c_o.jpg

6340709960_1bc022d748_o.jpg

▲3D Mark 11分別在P和X模式下的分數。
6340717682_155a1a7166_o.jpg

6339974223_15580aeac7_o.jpg

▲荒野雙蛟龍(Call of Juarez)在不同設定下的效能表現。
6340726302_3ec611db93_o.jpg

▲Final Fantasy XIV(太空戰士14)的測試成績。
6340730502_2f49b64788_o.jpg

▲Street Fighter 4(快打旋風4)測試成績。
6340731948_fa762208f6_o.jpg

6339984957_8c4a427a8a_o.jpg

▲然後,不能免俗地,也做了Unigine Heaven的測試。這兩張畫面分別是DirectX 11和OpenGL設定下的成績。
接著,就是這個平台在Windows Server 2008 R2 SP1底下的系統效能的部分:
6340688378_8eacf8379c_o.png

6340689518_af3e42f0a5_o.jpg

6339942849_950a7874ac_o.jpg

6340692018_4dd0b6a3ec_o.jpg

6339945293_7ce34e91b9_o.jpg

▲由於CPU-Z在測試期間的版本1.58未能完整而正確地辨識處理器,所以部分項目以AIDA64代勞。從圖片中各位也可清楚看到AMD的伺服器用南橋SP5100,實際上就是SB700的伺服器用版本。
6339958313_3de3298350_o.png

6340706608_79e6725a97_o.png

6340706834_ba733cddb8_o.png

6340707052_a39b47b30b_o.png

6340707200_9c2fc37d28_o.png

6340707364_a82545b85a_o.png

▲這個部分是Hyper π的測試成績,以目前Opteron的時脈來看,成績不如對手產品來的理想是可以預期的。
6339988759_880fb049d8_o.png

▲處理器快取及記憶體子系統的AIDA64測試成績。
6340703338_8380b842da_o.png

6340699622_5f3afc141f_o.png

6340699670_2226be2397_o.png

6340699724_c514229fea_o.png

6339951785_c9a6c08c1a_o.png

6340699884_dbd2e2d953_o.png

6339952143_244aeeae25_o.png

6340700264_8e1d8b15c6_o.png

6340700426_3e1139affc_o.png

6340700560_cf297b4c6d_o.png

6340700698_87b7846283_o.png

6339952839_e4b7483b85_o.png

6340700976_70c7906735_o.png

6340701114_03a7dc77e3_o.png

6340701250_de3b22eda6_o.png

6340701362_7eb06fa76d_o.png

6340701484_86d069e34a_o.png

6340701626_32a5cc3e2b_o.png

6340701748_de668c2e7f_o.png

▲以上的磁碟測試項目可以看出AMD的SP5100南橋在磁碟I/O方面的水準。
6340737642_87836d5034_o.jpg

6340738084_7165f713c1_o.jpg

6340738478_85de8fba9f_o.jpg

6340738904_6a6b8d8b29_o.jpg

6340739210_d5338fe94c_o.jpg

6340739456_218de32a6c_o.jpg

6340739624_760e4b186d_o.jpg

6340739906_b4bb8b0c67_o.jpg

6340740246_e7c4418b6e_o.jpg

6339991963_aeea3d96d1_o.jpg

6339992193_2cd3a6d1e9_o.jpg

6340741088_8bee887bd9_o.jpg

6339992747_d009589af3_o.jpg

6339992993_f7d8670607_o.jpg

6339993437_9fe6d89aef_o.jpg

6339993771_779d6b7c5b_o.jpg

6339994047_861c8613b9_o.jpg

6339994383_ceaf43c892_o.jpg

6339994689_3fd05608b0_o.jpg

6340743608_c5ceea351c_o.jpg

6339997637_188fd8d023_o.jpg

▲以上是SiSoftware Sandra (the System ANalyser, Diagnostic and Reporting Assistant) 在測試期間最新的SP5版本測試成績。
6339956765_92979bc049_o.jpg

6340706318_ec067a96af_o.jpg

▲現在進入了繪圖顯卡相關測試,先用甜甜圈來摧殘…
6340703206_b0d0a7531d_o.jpg

▲還有Lightsmark 2008進行光影特效的性能評估。
6340695678_5a9f116944_o.jpg

▲MicroStation Graphics Benchmark的部分,結果如上圖。
6340699468_d13bf411d5_o.jpg

▲POV-Ray的測試成績揭曉。
6339929415_b2e28fde5e_o.jpg

6339933003_c5aecfb386_o.jpg

6339936271_10a8530e2e_o.jpg

6339940181_eb7cb1a7ca_o.jpg

▲從Cinebench的測試成績來看,很明顯地,Opteron 6282SE的整體效能是因為以多核心數取勝,單核的表現甚至是倒退的。AMD必須趕快加把勁讓預設時脈得以拉高,否則面對對手兩年一改的步步進逼,在市場上很難抬得起頭。
6339918335_4927636c7c_o.jpg

6340667512_5e3cc55dd5_o.jpg

6340668510_e5d8ae5561_o.jpg

▲SPECViewperf 10的測試成績。
6340669484_1909708349_o.jpg

▲SPECViewperf 11的測試成績。
6339922369_eb5a9c588b_o.jpg

▲SolidWorks 2007的測試成績。很有趣的一點在於這個老benchmark在測試平台上發生成績忽快忽慢的情況,筆者測試過程中是第一回跑的分數會暴高,後面再跑又會超慢。不過以目前的硬體規格來看,總覺得該讓
這套測試軟體除役,畢竟準確度令人懷疑。
6343974073_90b85fbf29_o.jpg

▲redsdk turbine benchmark測試結果表。
6340664124_ddf75f2513_o.jpg

6340665324_e62cebdcb2_o.jpg

▲美超微的SuperDoctor III監控程式,由於這次的測試平台所用的電源供應器有配置PMBus接頭,所以會有電源相關的監控頁面。若使用者用的是一般不具備PMBus接頭的電源,或是沒有將這個接頭連接到主機板上,那就不會看到相關的監控頁面。
總結:
高時脈怪物走向的豪賭!以AMD在半導體製程及產能跟競爭對手相較,其差距如此巨大來看,Bulldozer架構的作法不啻為一種豪賭。雖然說這樣的架構對於實現高時脈是具有一定程度的優勢,且在本次測試中的確也在部分測試軟體中看出以多核心數量累積整體效能的優勢,但要這樣玩的先決條件是製程水準要領先對手。以Global Foundries的整體條件來看,筆者暫時持保留態度。畢竟目前業界在製程上,GF還不能算是領頭羊。對手在這塊領域所築出的防禦工事,光推土機還是難以撼其根基!加上要讓這樣的架構能發揮所長,還得要預計於明年國慶日前後才有望進入RTM的Windows 8/Windows Server 8加持。不過,對需要大量核心進行整數運算的資料處理來說,AMD新世代Opteron將會是很好的採購標的!
~Fin~
 

ccbxeon

榮譽會員
已加入
10/27/10
訊息
7,164
互動分數
8
點數
0
Server專用的推土機耶

果然實力不容小覷;rr;
 

CGEWAY

榮譽會員
已加入
11/2/03
訊息
3,916
互動分數
24
點數
38
AMD 核心滿出來.......
一般USER買這個.......
荷包肯定扁下去.......

題外話
這種CPU多弄個幾百台組串連
應該能串出超級電腦吧...
 

ccbxeon

榮譽會員
已加入
10/27/10
訊息
7,164
互動分數
8
點數
0
不只CPU..連MB也是很高貴
i101417_123.jpg
i101418_123.jpg

樓主介紹用的主機板Supermicro;ranger;
 

Abcb

高級會員
已加入
9/2/08
訊息
582
互動分數
0
點數
0
ataru一直都是supermicro控啊... 呵呵...

atarux能端出這種大傢伙出來似乎也不奇怪了^_^
 

BogyXie

一般般會員
已加入
10/14/11
訊息
191
互動分數
0
點數
16
年齡
34
這技術有點久遠了!
 

rickz008

哆啦A夢小矮子!?
已加入
11/2/10
訊息
2,120
互動分數
65
點數
48
網站
kazefuyuotsukai.blogspot.com
還蠻好奇Intel跟AMD在伺服器市場的佔有率會不會差很多......

單一顆核心的效能真的有點低落...不過32核心的海量實在是XDDDD
 

shine9001

一般般會員
已加入
6/19/11
訊息
192
互動分數
0
點數
0
核心再多對效能的提升有限,
除非整個作業系統的架構全改了
這得看微軟的意願的其他第三方軟體商的意願了
我對核心數是一點也不熱血
現在的pc並不是核心數高就真得比較強
 

alba642219

一般般會員
已加入
9/9/08
訊息
156
互動分數
0
點數
0
唯一可惜就是時脈2.6G有點少
要是預設就有3G或有自動超頻就好
這樣拿來玩game再吃cpu都沒再怕的
 
▌延伸閱讀