除了各位提到的simd, 在支持dma的平台上可以用dma优化. cpu需要做的只是告诉dma控制器, 源地址, 目的地址, 需要copy多少个、多少位宽的数据, 开始传输,等着完事。
单论传输时间不一定比直接赋值快(可能慢不少),但是在等待dma控制器那边说“传完了”的这段时间, cpu可以并行去干别的事了,总的来说还是快的。
ARM支持内存到内存的DMA传输(比内存到设备还是要慢一些),x86以前不支持,但是现在也有办法了,详细见链接:
还有这个:
共产主义政党长期治理的喀拉拉邦在印度处于人类发展指数的前茅,这就是共产主义对印度的影响。
另外,南亚人是非常非常喜欢取经名的。这也是一个地域特色了。