Open Nav

跨文档到HTML转换工具的跨域评估,用于在文档分析期间量化文本和

以下是资料介绍,如需要完整的请充值下载.
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.仅供学习参考之用.
   帮助中心
资料介绍:

跨文档到HTML转换工具的跨域评估,用于在文档分析期间量化文本和结构损失(中文7000字,英文PDF)
摘要
在取证文本分析中,在处理大量文档时,过程的自动化是关键。由于文档通常具有各种不同的文件类型,因此需要开发定制工具来分析每个文档,并且正确地识别提取的元素以便进行分析而不会丢失。这些文本提取工具通常会省略文档中无法读取的文本部分,在法医文本分析过程中会出现严重的不一致。作为这种解决方案,单一输出格式HTML被选为统一的分析格式。对HTML / CSS提取工具的文档进行了测试,每个工具都有不同的技术将常见文档格式转换为丰富的HTML / CSS对应文件。这种方法可以通过利用单一文档格式减少法医文本分析期间所需的分析工具的数量。设计了两个测试,一个10点文档概述测试和一个48点详细文档分析测试,以评估和量化输出HTML结构的损失程度,错误率和整体质量。本研究的结论是,利用多种不同方法并对文档结构有所了解的工具可以在损失最少的情况下获得最佳结果。 [来源:http://Doc163.com]

  [资料来源:http://Doc163.com]

  • 关于资料
    提供的资料属本站所有,真实可靠,确保下载的内容与网页资料介绍一致.
  • 如何下载
    提供下载链接或发送至您的邮箱,资料可重复发送,若未收到请联系客服.
  • 疑难帮助
    下载后提供一定的帮助,收到资料后若有疑难问题,可联系客服提供帮助.
  • 关于服务
    确保下载的资料和介绍一致,如核实与资料介绍不符,可申请售后.
  • 资料仅供参考和学习交流之用,请勿做其他非法用途,转载必究,如有侵犯您的权利或有损您的利益,请联系本站,经查实我们会立即进行修正! 版权所有,严禁转载
    doc163.com Copyright © 2012-2024 苏ICP备2021029856号-4