OCR是Optical Character Recognition(光学字符识别)的缩写。其定义为通过光学字符识别技术,将纸质文档、PDF、图片、照片等载体中的印刷体/手写体文字,自动转换为计算机可编辑、可搜索的纯文本格式,是一项“让AI从看见字到看懂字”的基础工作。核心目标在于高效提取文本,替代人工手动录入,降低重复劳动与错误率。