Основной контент книги Программное извлечение данных из word-документов на основе ситуационно-ориентированного подхода
Программное извлечение данных из word-документов на основе ситуационно-ориентированного подхода
ТекстmatnPDF

Hajm 18 sahifalar

2021 yil

0+

Программное извлечение данных из word-документов на основе ситуационно-ориентированного подхода

21 453,20 s`om
10% chegirma bering
Maslahat bering ushbu kitobni do'stingiz sotib olganidan 2 145,33 soʻm oling.

Kitob haqida

В статье рассмотрены вопросы применения ситуационно-ориентированного подхода для программной обработки word-документов. Рассматриваемые документы подготавливаются пользователем в среде текстового процессора Microsoft Word или его аналогов и используются в дальнейшем как источники данных. Открытость форматов Office Open XML и Open Document Format позволила применить концепцию виртуальных документов, отображаемых на ZIP-архивы, для программного доступа к XML-компонентам word-документов в ситуационно-ориентированной среде. Обоснована важность выработки предварительных соглашений относительно размещения информации в документе для последующего поиска и извлечения, например, с помощью заранее подготовленных шаблонов-заготовок. Для форматов DOCX и ODT рассмотрено использование ключевых фраз, закладок, элементов управления контентом, пользовательских XML-компонентов для организации извлечения введенных данных. Для каждого варианта построены древовидные модели доступа к извлекаемым данным, а также соответствующие XPath-выражения. Отмечено, что использование того или иного варианта зависит от функциональных возможностей и ограничений текстового процессора и характеризуется различной сложностью разработки шаблона-заготовки, внесения данных пользователем и программирования извлечения данных. Рассмотрен практический пример обработки метаданных научной статьи, подготовленной в среде Microsoft Word для публикации в научном журнале. Примененное решение основано на занесении метаданных в статью с помощью размещенных в шаблоне-заготовке элементов управления контентом, привязанных к элементам пользовательского XML-компонента. Разработанная иерархическая ситуационная модель HSM обеспечивает извлечение XML-компонента, загрузку его в DOM-объект и XSLT-преобразования для получения результирующих данных: отчета об ошибках и JavaScript-кода для последующего использования извлеченных метаданных.

Программное извлечение данных из word-документов на основе ситуационно-ориентированного подхода

Boshqa versiyalar

1 kitob 137 913,42 soʻm

Izoh qoldiring

Kirish, kitobni baholash va sharh qoldirish
Kitob А. С. Гусаренко, В. В. Миронова va boshqalar «Программное извлечение данных из word-документов на основе ситуационно-ориентированного подхода» - pdf-ga yuklab oling yoki internetda o'qing. Sharhlar va fikr-mulohazalarni qoldiring, o'zingiz yoqtirganlarga ovoz bering.
Yosh cheklamasi:
0+
Litresda chiqarilgan sana:
01 fevral 2022
Yozilgan sana:
2021
Hajm:
18 Sahifa
Umumiy o'lcham:
965 КБ
Umumiy sahifalar soni :
18
Mualliflik huquqi egasi:
Синергия
Yuklab olish formati:

Ushbu kitob bilan o'qiladi

Muallifning boshqa kitoblari