在实现memory copy的时候,是用MOVS直接从memroy拷贝到memroy
还是用MOV先拷贝到register,然后再拷贝到memroy快呢?我想问题的根结在于MOVS需不需要把memory的内容先读到CPU里面来。
从我查到资料来看最快的方法是,合理的控制cache,然后用movq从cache中读取data到mmx register中,然后用movntq写到memory中。不知道是不是这样是最快的?
我的背景是这样的,需要在内核态完成1M的内存拷贝,越快越好了,因为每秒需要做60次这样的拷贝。这些内存(目标和源)实际上都是给集成显卡用的显存,软件本身不需要访问这些内存。