![](/img/3f837c9465b99c34e55550954d94ae72.png)
使用tesseract,效果不佳。
更改ghostscript输出DPI(600、300、150、96)表明,在96 DPI处的图像可从tesseract获得最佳效果,但仍不令人满意。现在我想征求意见,哪种过滤器可以增强此图像的OCR处理效果。
我可以使用imagemagick或numpy / scipy / ndimage
#1 楼
您真正需要的可能是一些形态学操作,例如扩张然后腐蚀。这称为关闭操作。可能是您的情况-扩张本身可能很好。以前有一个类似的问题-可以在其他方面提供帮助。
单色(1位黑白)图像转换
如何仅使用形态学操作从图像重建文本?
#2 楼
您可以使用低通滤波器将其删除。这可以在频率空间中完成,也可以仅获取图像的高斯(差异)。![](/img/c65c427732df53da775d4cdac8c12657.png)