Matches in SemOpenAlex for { <https://semopenalex.org/work/W3038152386> ?p ?o ?g. }
Showing items 1 to 51 of
51
with 100 items per page.
- W3038152386 endingPage "158" @default.
- W3038152386 startingPage "149" @default.
- W3038152386 abstract "Дослідження присвячене розробці системи аналізу текстових потоків даних. В постановці завдання наведено проблему обробки потоків текстової інформації та відзначається відсутність програмних засобів одночасної обробки потоків текстових даних українською та російською мовами. Проведено аналіз останніх досліджень та встановлено, що для обробки потоків даних необхідно застосовувати спеціалізоване програмне забезпечення обробки потокових даних. Виявлено, що існує вкрай мало засобів для обробки україномовних текстів, а також те, що не існує засобів для одночасної підтримки україномовних та російськомовних текстів. Метою даного дослідження є розробка архітектури та реалізація програмного забезпечення системи аналізу текстових потоків даних. Наведено опис математичної моделі потоку текстових даних на основі ковзного вікна. Наведено завдання для обробки потоків текстових даних від базових перетворень тексту та попередньої обробки до інтелектуального аналізу текстових потоків даних. Сформульовано математичну постановку завдання визначення емоційного забарвлення потоків текстових даних на основі моделі ковзного вікна. В процесі дослідження виділено 4 підсистеми: підсистему збору та транспортування повідомлень потоків даних, підсистему аналізу текстових потоків, підсистему зберігання результатів аналізу потоків даних та підсистему візуалізації. Особливістю системи є підтримка обробки україномовних текстів, для чого було спеціально розроблено програмну бібліотеку UANLP. Дана бібліотека дозволяє також оброблювати російськомовні тексти. Обробка потоків текстових даних виконується на основі компоненту Spark Streaming, що підтримує роботу з вікнами. Бібліотека Spark MLib та ML дозволяють використовувати засоби машинного навчання для аналітичної обробки потоків текстових даних, на основі яких виконується сентимент аналіз, виявлення аномалій, елементів пропаганди, дезінформації тощо. Обґрунтовано використання програмних компонент - сервісу повідомлень Kafka, технології розподіленої обробки даних Apache Spark, бази даних Elasticsearch та сервісу візуалізації Kibana. Описано процес обробки даних від генерації потоків даних до візуалізації результатів аналізу." @default.
- W3038152386 created "2020-07-10" @default.
- W3038152386 creator A5076241604 @default.
- W3038152386 date "2020-01-01" @default.
- W3038152386 modified "2023-09-24" @default.
- W3038152386 title "СИСТЕМА АНАЛІЗУ ТЕКСТОВИХ ПОТОКІВ ДАНИХ" @default.
- W3038152386 doi "https://doi.org/10.32782/2618-0340/2020.1-3.15" @default.
- W3038152386 hasPublicationYear "2020" @default.
- W3038152386 type Work @default.
- W3038152386 sameAs 3038152386 @default.
- W3038152386 citedByCount "0" @default.
- W3038152386 crossrefType "journal-article" @default.
- W3038152386 hasAuthorship W3038152386A5076241604 @default.
- W3038152386 hasBestOaLocation W30381523861 @default.
- W3038152386 hasConcept C124242999 @default.
- W3038152386 hasConcept C127413603 @default.
- W3038152386 hasConcept C199360897 @default.
- W3038152386 hasConcept C2777703250 @default.
- W3038152386 hasConcept C2781215313 @default.
- W3038152386 hasConcept C41008148 @default.
- W3038152386 hasConcept C511840579 @default.
- W3038152386 hasConcept C78519656 @default.
- W3038152386 hasConceptScore W3038152386C124242999 @default.
- W3038152386 hasConceptScore W3038152386C127413603 @default.
- W3038152386 hasConceptScore W3038152386C199360897 @default.
- W3038152386 hasConceptScore W3038152386C2777703250 @default.
- W3038152386 hasConceptScore W3038152386C2781215313 @default.
- W3038152386 hasConceptScore W3038152386C41008148 @default.
- W3038152386 hasConceptScore W3038152386C511840579 @default.
- W3038152386 hasConceptScore W3038152386C78519656 @default.
- W3038152386 hasIssue "1" @default.
- W3038152386 hasLocation W30381523861 @default.
- W3038152386 hasOpenAccess W3038152386 @default.
- W3038152386 hasPrimaryLocation W30381523861 @default.
- W3038152386 hasRelatedWork W10057826 @default.
- W3038152386 hasRelatedWork W12602586 @default.
- W3038152386 hasRelatedWork W14695962 @default.
- W3038152386 hasRelatedWork W3558228 @default.
- W3038152386 hasRelatedWork W4212815 @default.
- W3038152386 hasRelatedWork W4273105 @default.
- W3038152386 hasRelatedWork W5331272 @default.
- W3038152386 hasRelatedWork W5357267 @default.
- W3038152386 hasRelatedWork W677203 @default.
- W3038152386 hasRelatedWork W9921517 @default.
- W3038152386 hasVolume "3" @default.
- W3038152386 isParatext "false" @default.
- W3038152386 isRetracted "false" @default.
- W3038152386 magId "3038152386" @default.
- W3038152386 workType "article" @default.