EAST 场景文字检测

EAST 场景文字检测

EAST: An Efficient and Accurate Scene Text Detector arXiv:1704.03155v2EAST 是文字检测算法,输入:图片,输出: 图片中文字的位置EAST 的主要创新在对文字位置的定义,也就是文字检测这个问题的定义. 从而简化整个检测的流程,达到比较好的速度和准确率。EAST 主要考虑的是文字标注为四边形的情况,文中提出了两种方式, 带角度的矩形框 (RBOX) 和 四边形 (QUAD)。 我解释下 QUAD , RBOX 相对会更加复杂和麻烦。如果我们把最终的特征上采样到和输入图片一样大,EAST 相当于是在每个像素点预测当前像素...

机器学习 2020-03-09 PM 324℃ 0条
目标检查中的 Anchor

目标检查中的 Anchor

在 Faster R-CNN 中引入的 RPN 分支利用对 Anchor 的分类(前景还是背景)和位置回归来选择 Region Proposal 和调整其位置。Anchor 对应到输入图像是就是一个矩形区域,对应到特征图(feature map)上的一个特征点。在原图上可以用左上角和右下角两个点坐标来定义: [x_min, y_min, x_max, y_max]Anchor 的生成在早些时候是用一个框在图像上滑动,比如下面这样,每个小方块就是一个选取的区域,对这个区域提取特种,并分类Anchor 的生成和这个逻辑类似,我们定义图书这些方块的边长为 base_size , 在每个位置,...

机器学习 2020-02-19 PM 197℃ 0条
利用序列模型实现 HTML 信息抽取

利用序列模型实现 HTML 信息抽取

爬虫从互联网获取的数据是非结构化的, 信息抽取会成为很多重要的环节。我要抽取的是从各种不同的网站获取的 HTML 中的中标信息,HTML 来自成千上万的网站,下面是两个例子截图,红色部分为需要抽取的内容。要抽取的内容是第一中标公司,第一中标公司的联系人和对应中标金额共三个字段。可以看到这和通用的实体抽取还有些区别,有点儿角色标注的意思。 第一个想到的是用实体识别的方法,但是 HTML 是有结构信息的,简单的扔掉 HTML 标签从纯文本中抽取,将导致很多信息的丢失,比如表格信息,“第一中标人”这个表头,很可能就和对应的公司在纯文本中相距甚远,导致最终很难到一个比较好的效果。另一个想法是利用...

机器学习 2020-02-17 AM 109℃ 0条
mmdetection data pipeline

mmdetection data pipeline

mmdetection 是基于 Pytorch 的目标检测框架。本文对整个数据的处理流程做一个梳理Pytorch data utilsDatasetPytorch 定义了一个相当方便和简洁的数据流程,在 torchvision 中也有比较好的实现,Dataset 的接口定义如下, 主要重写 object 的两个方法, __getitem__ 和 __len__ 这个类的作用是存储原始数据相关的信息,我们要实现自己的Dataset 可以继承这个类,实现两个抽象方法就好class Dataset(object): r"""An abstract clas...

机器学习 2020-01-30 PM 604℃ 0条