tesseract的psm模式有哪些?

软件: tessera
全方位数据报表
许可分析

许可分析

免费体验
识别闲置、及时回收
许可优化

许可优化

免费体验
多维度智能分析
许可分析

许可分析

免费体验
减少成本、盘活许可
许可优化

许可优化

免费体验
Tesseract OCR的PSM(页面分割模式)共有14种,适用于不同场景的文本识别。以下是主要模式分类及适用场景:

一、基础方向检测组模式

OSD_ONLY :仅检测文字方向(不识别内容),适用于判断图像正反。

AUTO_OSD :自动检测方向并识别中英文,适合混合语言场景。

SPARSE_TEXT_OSD :检测稀疏文字方向,适用于多语言混合或旋转文档。

二、常规文档组模式

tesseract的psm模式有哪些?

AUTO :默认模式,自动处理多列/段落,适合标准排版文档。

SINGLE_COLUMN :强制单列识别,避免跨列误连,适合杂志文章。

SINGLE_BLOCK :将区域视为整块文本,适合简历、表格等整齐布局。

三、精准定位组模式

SINGLE_LINE :识别单行文本,如车牌、标语。

SINGLE_WORD :识别单个单词,避免字符拆分,适合验证码。

SINGLE_CHAR :逐字识别,适合字符分类任务。

四、特殊排版组模式

SINGLE_BLOCK_VERT_TEXT :识别竖排文本(需安装垂直语言包),如古籍、日文。

CIRCLE_WORD :识别环形排列文字(如徽标),需特殊处理。

五、高级处理组模式

SPARSE_TEXT :逐字识别分散文本,适合街景广告牌。

RAW_LINE :绕过预处理直接识别紧密排列的计算机生成字体。

使用建议 :根据文本特征选择模式,例如识别身份证号码可用PSM 6将整张图片视为文本块,并通过--c tessedit_char_whitelist限制字符集提高准确率。

index-foot-banner-pc index-foot-banner-phone

点击一下 免费体验万千客户信任的许可优化平台

与100+大型企业一起,将本增效

与100+大型企业一起,将本增效

申请免费体验 申请免费体验