好贷网好贷款

matlab上使用open CL的精度损失

发布时间:2016-12-3 17:40:12 编辑:www.fx114.net 分享查询网我要评论
本篇文章主要介绍了"matlab上使用open CL的精度损失",主要涉及到matlab上使用open CL的精度损失方面的内容,对于matlab上使用open CL的精度损失感兴趣的同学可以参考一下。

在matlab下用openCL写了一个简单的矩阵pooling算法,也就是将一个矩阵的行列减半,每四个元素求平均值。发现使用直接迭代和使用openCL的结果存在部分值不相等的情况。起初以为是程序编写问题,经仔细检查发现是GPU上的单精度对比CPU单精度存在精度损失的情况,GPU上的浮点数是符合IEEE754标准的,而CPU的浮点数通常是过度设计的。对此,《深入理解计算机系统》中说到过,CPU的fpu寄存器位数为80位(指双精度浮点数,单精度浮点数也是高于IEEE标准,通常是40位)。然后运行clinfo发现float的最大传输量为4,SIMD数据长度为128,因此GPU的寄存器位数为32位(我的GPU只支持单精度浮点数)。幸好精度损失不大。 首先主文件 clear clc num = []; error = []; for k = 3:10 num = [num 2^k]; [A, data] = testCL(2^k); nativeTest1; error = [error mean(mean(A-B))]; end 然后是直接pooling for i = 1 : size(data,1)/2 for j = 1 : size(data,2)/2 B(i,j) = (data((i-1)*2+1, (j-1)*2+1) + data((i-1)*2+1, j*2) + data(i*2, (j-1)*2+1) + data(i*2, j*2))/4; end end 再就是opencl的 function [values,data] = testCL(num) tic ocl = opencl(); ocl.initialize(1, 2); ocl.addfile('matrix.cl'); ocl.build(); n = int32(num); m = n / 2; x = clbuffer('ro', 'single', n*n); z = clbuffer('rw', 'single', m*m); x.set(rand(n,n)); z.set(zeros(m,m)); poolkernel = clkernel('mm', [m, m, 0], [1, 1, 0]); poolkernel(x, z, m); values = z.get(); time = toc data = x.get(); data = reshape(data,n,n); values = reshape(values,m,m); end kernel文件 __kernel void mm(__global const float *x, __global float *z, int N) { const int ix = get_global_id(0); const int iy = get_global_id(1); const int width = 2*N; z[iy*N+ix] = (x[(iy*2)*width+ix*2] + x[(iy*2)*width+ix*2+1] + x[(iy*2+1)*width+ix*2] + x[(iy*2+1)*width+ix*2+1])/4; } 精度损失如下 num = 8 16 32 64 128 256 512 1024 error = 1.0e-08 * 0.1863 -0.3725 0.0233 0.0466 0.0004 0.0003 -0.0019 0.0040 上面为方阵的大小,下面是对应的精度损失

上一篇:浅析 Linux 中的时间编程和实现原理一—— Linux 应用层的时间编程
下一篇:tr 使用

相关文章

相关评论