基于循环投影统计的数学公式自动定位方法

发布日期:2013 年5 月20 日
基于循环投影统计的数学公式自动定位方法 基于循环投影统计的数学公式自动定位方法

本内容试读结束

下载后可阅读完整内容,立即下载

基于循环投影统计的数学公式自动定位方法

:数学公式自动识别的第一步就是数学公式定位,只有从文档图像里正确定位出公式,后续的步骤如公式符号识别、公式版面分析、公式语义分析才能进行。本文根据中文文字特性,设计了一种基于循环投影统计的数学公式定位方法,该方法首先通过投影来统计关键信息,然后提取出可疑行,最后通过一系列条件进行可疑行的确认。实验结果表明本文提出的方法在计算成本非常低的前提下能保证结果的正确性。

数学公式大量存在于各类科技文献之中,特别是在许多重要的文献中,由数学公式构成的科技准则常常占据着文献的核心地位。目前主流的OCR 系统在 处理文本方面已经具备很高的精确度和时效,但在处理数学公式方面还不尽如人意,当人们想要验证或想要重新使用数学公式时,只能借助于专门的数学排版工具或数学计算工具依据其规则重新输入,无法解决手动输入的低效率以及实现公式的自动化输入问题。

*基金项目:国家自然科学基金资助项目(61072121,61271382);湖南省自然科学基金资助项目(12JJ2035);江西省教育厅资助科研项目(GJJ11665);湖南大学中央高校基本科研业务费资助项目。

数学公式自动识别可以分为四个步骤:数学公式自动定位、数学公式符号识别、数学公式分析、公式 Copyright © 2013 Hanspub 37



相关标签