OCR病历识别

OCR识别技术相对于传统的手工录入方式来说,具有强大的优势。首先,OCR文字识别的速度远快于手工录入。根据国际通行的打字速度评级标准,即使是专业人员,每分钟也仅能输入150~240个字,而采用OCR技术,即使算上前后期的处理环节所花时间,其速度也绝对比前者快好几倍。
图片文件类型支持PNG、JPG、JPEG等格式。
为获得准确的结果,请上传文本清晰、端正的图片。

更新日志

  • V1.1.5
    2020-5-25 09:00
    版本更新:
    2020-ocr表格文档识别模型优化上线,基于原有ocr表格文档识别,扩增数据集进行优化训练,新版本具有更强的泛化性,可实现表格线多样式的表格文档的检测识别。
  • V1.1.4
    2020-3-30 15:00
    版本更新:
    2020-ocr表格文档识别上线,ocr表格文档识别可实现表格文档的结构化识别,在保持原有表格结构信息的情况下,识别输出表格文档信息。
  • V1.1.3
    2019-11-11 09:00
    版本更新:
    ocr识别模型优化上线,根据自定义的专业性数据集,对现有ocr识别模型进行了优化,提高文本识别准确率。
  • V1.1.2
    2019-09-28 15:00
    版本更新:
    ocr预处理模型替换,将原有传统预处理方案替换为超分预处理,提高模糊文本识别准确率。
  • V1.1.1
    2019-08-09 12:00
    版本更新:
    ocr检测模型的细节优化,根据最新数据集优化所得,对于特定场景的检测更加精准。
  • V1.1.0
    2019-07-15 09:10
    版本更新:
    ocr检测模型替换,将ocr原有文本检测模型替换为新的文本检测模型,可实现自然场景的文本检测。

平台介绍

平台主要从事文本检测、文字识别、版面分析、图表分析等方面的技术研究,项目开展重点围绕医疗方面的应用,主要包括医学病例识别、医学检测报告识别、医学相关文献识别等。

数据量

  • 医学字符集
    1500万
  • 其他字符集
    1200万
  • 自定义数据集
    660万
  • 可识别字符量
    6542