博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【失败经验分享】android下使用支持opencl的cv::dft()
阅读量:5841 次
发布时间:2019-06-18

本文共 2802 字,大约阅读时间需要 9 分钟。

1.使用了UMat,但是并未使用GPU计算

cv::dft()函数的定义是:

void cv::dft( InputArray _src0, OutputArray _dst, int flags, int nonzero_rows )

dft()函数中这样调用opencl的版本:

#ifdef HAVE_OPENCL    CV_OCL_RUN(_dst.isUMat() && _src0.dims() <= 2,               ocl_dft(_src0, _dst, flags, nonzero_rows))#endif

然后程序在ocl_dft()函数的如下位置返回false:

// if is not a multiplication of prime numbers { 2, 3, 5 }    if (ssize.area() != getOptimalDFTSize(ssize.area()))        return false;

于是突然领悟了:为什么opencl版本调用的时候比CPU版本还要更慢?因为程序并未返回内部的状态,如果opencl调用失败,就会转到CPU版本去计算。但是传入的数据是UMat,导致CPU版本还要从设备内存下载数据到主机内存,必然更慢。

然后找到了这篇帖子解决了上面条件判断返回false的问题:

核心代码如下:

Mat padded;                            //expand input image to optimal sizeint m = getOptimalDFTSize( I.rows );int n = getOptimalDFTSize( I.cols ); // on the border add zero valuescopyMakeBorder(I, padded, 0, m - I.rows, 0, n - I.cols, BORDER_CONSTANT, Scalar::all(0));Mat planes[] = {Mat_
(padded), Mat::zeros(padded.size(), CV_32F)};Mat complexI;merge(planes, 2, complexI); // Add to the expanded another plane with zerosdft(complexI, complexI); // this way the result may fit in the source matrix

2.opencl核函数编译失败

继续往后执行,debug版本opencv输出以下信息:

[ INFO:0] Specify OPENCV_OPENCL_CACHE_DIR configuration parameter to enable OpenCL cacheOpenCL program build log: core/fftStatus -11: CL_BUILD_PROGRAM_FAILURE-D LOCAL_SIZE=36 -D kercn=12 -D FT=float -D CT=float2 -D RADIX_PROCESS=fft_radix4_B3(smem,twiddles+0,ind,1,9);fft_radix3_B4(smem,twiddles+3,ind,4,12);fft_radix3_B4(smem,twiddles+11,ind,12,12); -D COMPLEX_INPUT -D COMPLEX_OUTPUTBC-src-code:429:12: error: '__local' can only appear in __kernel functions at function scope __local CT smem[LOCAL_SIZE];            ^BC-src-code:499:12: error: '__local' can only appear in __kernel functions at function scope __local CT smem[LOCAL_SIZE];            ^BC-src-code:558:12: error: '__local' can only appear in __kernel functions at function scope __local CT smem[LOCAL_SIZE];            ^BC-src-code:644:12: error: '__local' can only appear in __kernel functions at function scope __local CT smem[LOCAL_SIZE];            ^4 diagnostic(s) generated.

出错的代码是:

bool enqueueTransform(InputArray _src, OutputArray _dst, int num_dfts, int flags, int fftType, bool rows = true) const

ocl::Kernel k(kernel_name.c_str(), ocl::core::fft_oclsrc, options);        if (k.empty())            return false;

我的android手机是opencl 2.0版本,暂不清楚opencv开发者所用的fft.cl对应的opencl版本是什么。由此说明之前并没有人在android下去做opencl版本的dft()函数的兼容。

下一步是认真分析fft.cl的语法,想办法在android下可以编译通过。

===================================

2019-06-26 20:48补充:
核函数这里解决了:
'__local' can only appear in __kernel functions at function scope
声明为__local的变量,只能定义在函数的顶级作用域,例如写在if()里面是不行的。
因此,把所有if, for 等括号里面的__local变量定义放在函数开始处就解决了。
opencv中的ocl_dft()终于跑起来了!

转载于:https://www.cnblogs.com/ahfuzhang/p/11090544.html

你可能感兴趣的文章
因为本人工作繁忙,精力有限,本博客停止更新。有兴趣的博友可以关注我在CSDN上的主博客...
查看>>
SQL server查看触发器是否被禁用
查看>>
[C++基础]在构造函数内部调用构造函数
查看>>
跟随我在oracle学习php(8)
查看>>
Spring 3.1.0 Hibernate 3.0 Eclipse Spring WEB例子
查看>>
UVA-10212 The Last Non-zero Digit. 分解质因子+容斥定理
查看>>
求两个集合的交集,并集,差集
查看>>
Kotlin的语法糖(一)基础篇
查看>>
OkHttp源码分析
查看>>
让你的app体验更丝滑的11种方法!冲击手机应用榜单Top3指日可待
查看>>
windows kernel exploitation基础教程
查看>>
NS_OPTIONS枚举的用法
查看>>
java9系列(九)Make G1 the Default Garbage Collector
查看>>
QAQ高精度模板笔记√
查看>>
Jmeter计数器的使用-转载
查看>>
【Android笔记】入门篇02:全屏设置和禁止横屏竖屏切换
查看>>
4. Median of Two Sorted Arrays
查看>>
Kubernetes的本质
查看>>
PL/SQL developer 管理多套数据库
查看>>
黑马程序员-分类(category)
查看>>