跳到主要内容

OCR 设置

在此面板，您不仅能选择最合适您游戏场景的光学字符识别引擎和处理模型，还能通过精细的调节参数，自定义图像增强和文字块的段落重组合并方式。从而应对各种带有复杂排版和噪点的 UI 界面。

识别模型和图像前处理增强

OCR 语言识别库

系统引擎提供了高度细分的离线视觉识别模型来提高处理速度和精度。通过下拉菜单进行大类选择：

中英日模型（默认）：兼顾最主流的欧美和日系游戏界面，主力模型。
繁体中文模型、韩文模型、拉丁字母语言模型、西里尔字母语言模型、阿拉伯语模型、希腊语模型：对于完全只出现一种特定语系的情况，可以手动切换来摒弃通用模型可能存在的错误匹配。

OCR 速度及精准度模型

根据电脑自身性能与要求反馈的响应时间，可在以下三档模式中切换：

标准：通常建议。综合速度与检出率最优。
精准：识别速度稍慢但文本检出率和标点符号命中率可以实现极高的水平。
快速：识别出结果延迟极低，适用于运行在低清或显卡不宽裕、对延迟极度敏感的环境下。

图像前处理增强

游戏画面往往并不是最优质的"黑底白字"排文，这些开关用于在把截图传入 OCR 引擎前"整顿"画质：

增强对比度：如果因为游戏场景过于黑暗（例如洞穴深处或者有背光导致截取的字体暗淡），此项可提升文本亮度与背景区别度。
锐化：某些 VR 游戏抗锯齿设置过高或分辨率跟不上时，字体边缘易发虚，开启此处对原生文字边缘进行边界重塑和锐度强化。
降噪：适合用于画质颗粒感重或者拥有大量干扰效果（如复古滤镜、像素风环境、雾气粒子干扰等），能避免误读取为奇怪的符号。

OCR 面板合并与排版深度设置

由于游戏界面的对话框往往有自己天马行空的字符间距和断行规则，部分断行或者空行会被简单地当做独立的句子导致单次翻译成"车祸现场"。下列的所有滑块（带有重置↺功能）可以极大程度改变系统的合并判断行为。

预设合并参数一键策略

为您预先设定的经验值组合。当您随意拉动下方的任何详细滑块时，也会自动跳转到**"自定义"**配置槽位上。

预设档位：无（极少合并）/ 窄 / 标准 / 宽（容忍更多乱行导致的距离断裂）

文本块横向合并容差

合并高度容差：限制相连两个文本块的整体高低差距。通过这层滤网能避开同宽但大小不一的"UI元素杂质"被并入一句话里的危险。（默认 0.2）
水平高度容差：处理长文单行文本时，限制水平距离内能跨过最高与最低字体的比例极值。（默认 0.1）
水平重叠像素边界：设定 -20 至 20px。负数表示允许字间隔，正数表示需要相互叠加或字体重叠。（默认 -2）
水平 Y 轴最大间距：判断两个横向排列的词组是否"属于同一行"而设立的纵截面极差范围。（默认 0.5）

文本段落垂直重构与换行判定

垂直高度容差：限制上下文关联时的垂直极限容错。（默认 0.3 / 0.5）
垂直 X 轴对齐容差：限制了上下相邻两行首字对齐偏移的情况不能超过多少个字符宽度。（默认 1.5）
垂直最大间距：同一次翻译请求中所允许的空行截断极限，超过这间距将被抛弃或视为不同句。（默认 0.15）
垂直角度容差：应对一些有倾斜设计或者弧度的对话面板。单位为角度。（默认 2.0°）
垂直重叠最小比例：垂直相连元素发生上下切边重叠时所允许的最小基准。（默认 0.0）
垂直段落间距倍数：检测到垂直距离超过系统标准行距多少倍时就将下面认定成新段落，触发强制换行。（默认 1.5）
垂直最小新段落间距：同上判定要求，设定强制新段的最少相隔固定物理像素阈值。（默认 80 到 150px）

识别模型和图像前处理增强
OCR 面板合并与排版深度设置