栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

在itextpdf中应用位置提取策略后,我们可以使用文本提取策略吗?

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

在itextpdf中应用位置提取策略后,我们可以使用文本提取策略吗?

请看一个

ParseCustom
例子。在此示例中,我们创建了一个自定义
RenderFilter
(不是
TextExtractionStrategy
):

class FontRenderFilter extends RenderFilter {    public boolean allowText(TextRenderInfo renderInfo) {        String font = renderInfo.getFont().getPostscriptFontName();        return font.endsWith("Bold") || font.endsWith("Oblique");    }}

该文本将过滤所有文本,以便仅Postscript字体名称以粗体或斜体结尾的文本。

这是您使用此过滤器的方式:

public void parse(String filename) throws IOException {    PdfReader reader = new PdfReader(filename);    Rectangle rect = new Rectangle(36, 750, 559, 806);    RenderFilter regionFilter = new RegionTextRenderFilter(rect);    FontRenderFilter fontFilter = new FontRenderFilter();    TextExtractionStrategy strategy = new FilteredTextRenderListener( new LocationTextExtractionStrategy(), regionFilter, fontFilter);    System.out.println(PdfTextExtractor.getTextFromPage(reader, 1, strategy));    reader.close();}

如您所见,我们创建了一个

FilteredTextRenderListener
包含两个过滤器的,一个
RegionTextRenderFilter
和我们基于字体的自制过滤器。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/516415.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号