45納米加入了SSE4.1指令集,令處理器的多媒體處理能力得到最大70%的提升。SSE4加入了6條浮點型點積運算指令,支持單精度、雙精度浮點運算及浮點產生操作,且IEEE 754指令 (Nearest, -Inf, +Inf, and Truncate) 可立即轉換其路徑模式,大大減少延誤,這些改變將對游戲及 3D 內容制作應用有重要意義。此外,SSE4加入串流式負載指令,可提高以圖形幀緩衝區的讀取數據頻寬,理論上可獲取完整的快取緩存行,即每次讀取64Bit而非8Bit,並可保持在臨時緩衝區內,讓指令最多可帶來8倍的讀取頻寬效能提升,對于視訊處理、成像以及圖形處理器與中央處理器之間的共享數據應用,有著明顯的效能提升。
第二類指令是面向應用的加速指令ATA。ATA包括冗余校驗的CRC32指令、計算源操作數中非0位個數的POPCNT指令,以及對于打包的64位算術運算的SIMD指令。CRC32指令可以取代上層數據協議中經常用到的循環冗余校驗,據Intel表示其加速比可以達到6.5~18.6倍;POPCNT用于提高在DNA基因配對、聲音識別等包含大數據集中進行模式識別和搜索等操作的應用程序性能。 Intel也公布了支持新指令集的開發工具。這些工具涵蓋了主流的編譯開發環境。目前已明確支持SSE4.2的開發環境包括:Intel C++ Compiler 10.X、微軟的Visual Studio 2008 VC++、GCC 4.3.1、Sun Studio Express等。程序員可以直接使用高級編程語言編程,編譯器會自動生成優化結果。當然程序員也可以用內嵌匯編的方式來達到目的。