不過LDDQU(Load Unaligned Integer 128 bits)是視訊編碼用,不知道為何不加上?
可能是因為這是針對P4的cache boundries去量身定做的關係吧?也酗]可改用movdqu
去對應也行(LDDQC是比較快速的movdqu,不過在UC/USWC可能會有讀取上的問題
,對應於A64 Rev. E 上頭有4個write combining buffer,的確需要考量相容性) [/b]
http://akiba.ascii24.com/akiba/column/late...648472-001.html...