donut是一种新的文档理解方法,使用无ocr端到端transformer模型,在各种视觉文档理解任务上显示出最先进的性能。此外,synthdog是一种合成文档生成器,帮助模型预训练在各种语言和领域上具有灵活性。预训练模型和web演示可用于文档解析、文档分类、文档vqa和(伪)文本阅读任务。代码和数据集在mit许可下在github上可用。
未经允许不得转载:ag凯发k8国际 » donut:无需 ocr 理解文档内容
donut是一种新的文档理解方法,使用无ocr端到端transformer模型,在各种视觉文档理解任务上显示出最先进的性能。此外,synthdog是一种合成文档生成器,帮助模型预训练在各种语言和领域上具有灵活性。预训练模型和web演示可用于文档解析、文档分类、文档vqa和(伪)文本阅读任务。代码和数据集在mit许可下在github上可用。
未经允许不得转载:ag凯发k8国际 » donut:无需 ocr 理解文档内容