[表格重构]Complicated Table Structure Recognition

[表格重构]Complicated Table Structure Recognition

论文Complicated Table Structure Recognition 尝试用图的方法重构表格的结构。 文章代码文章想解决的问题如上图,在表格重构的时候文本块是属于同一行还是下一行肉眼很清楚,但是机器一般很难做到,存在单元格合并的问题。文章的整个做法如下图:从 PDF 中提取文本 chunk 的坐标和内容, 然后根据 chunk 之间的关心构造一个图,模型输入是顶点和边的特征,...

机器学习 2020-03-31 PM 116次 0条
DB 场景文字检测

DB 场景文字检测

文章Real-time Scene Text Detection with Differentiable Binarization 提出的文字检测模型 DB 是 Differentiable Binarization 缩写。基于分割的方法通常需要设着一个阈值来判断像素是否属于文字区域。作者发现对每个像素分类的模型最终产生的概率分布会呈现出边界比较高概率的样子。所以为了让分割效果更加稳定引入了...

机器学习 2020-03-28 PM 216次 0条
EAST 场景文字检测

EAST 场景文字检测

EAST: An Efficient and Accurate Scene Text Detector arXiv:1704.03155v2EAST 是文字检测算法,输入:图片,输出: 图片中文字的位置EAST 的主要创新在对文字位置的定义,也就是文字检测这个问题的定义. 从而简化整个检测的流程,达到比较好的速度和准确率。EAST 主要考虑的是文字标注为四边形的情况,文中提出了两种方式, 带...

机器学习 2020-03-09 PM 216次 0条
目标检查中的 Anchor

目标检查中的 Anchor

在 Faster R-CNN 中引入的 RPN 分支利用对 Anchor 的分类(前景还是背景)和位置回归来选择 Region Proposal 和调整其位置。Anchor 对应到输入图像是就是一个矩形区域,对应到特征图(feature map)上的一个特征点。在原图上可以用左上角和右下角两个点坐标来定义: [x_min, y_min, x_max, y_max]Anchor 的生成在早些时...

机器学习 2020-02-19 PM 144次 0条
利用序列模型实现 HTML 信息抽取

利用序列模型实现 HTML 信息抽取

爬虫从互联网获取的数据是非结构化的, 信息抽取会成为很多重要的环节。我要抽取的是从各种不同的网站获取的 HTML 中的中标信息,HTML 来自成千上万的网站,下面是两个例子截图,红色部分为需要抽取的内容。要抽取的内容是第一中标公司,第一中标公司的联系人和对应中标金额共三个字段。可以看到这和通用的实体抽取还有些区别,有点儿角色标注的意思。 第一个想到的是用实体识别的方法,但是 HTML 是有结...

机器学习 2020-02-17 AM 94次 0条