在灵闪里,如何快速提取图片中的文字

Viewed 33

20251022_102706_0_OK_102210,1959995.JPEG20251023_154938_832530900.png

现在有10000张类似图像,如何快速拿到作业耗时和模型耗时结果列表

1 Answers

主体的识别过程:

  1. ocr工具,不管是传统的,还是深度学习的,应该都能检出的。尤其是在红色通道上进行,会进一步降低背景对检出的影响。
  2. 这个字体很特别,等宽、栅格化明显,那么可以考虑用基于斑点分析的分类工具,按斑点的面积、长宽比、孔洞个数、圆度凸度等属性,就能分辨0-9以及小数点。
  3. 更甚至,可能数红色像素点就能做到。

2和3方法,后续需要再配合收集工具,把单个字符整合为字符串。1方法直接得到字符串。

得到字符串后,就是到py脚本里统一处理到double,然后csv输出。

如果字符的位置不固定,前序加定位工具按“作业耗时”、“模板耗时”或者“ms”和“:”做模板匹配。