Matches in SemOpenAlex for { <https://semopenalex.org/work/W2007609084> ?p ?o ?g. }
- W2007609084 endingPage "694" @default.
- W2007609084 startingPage "683" @default.
- W2007609084 abstract "인터넷 사용이 급속도로 증가함에 따라 XML/HTML 문서와 같이 트리 구조로 표현되는 데이터의 변화 탐지가 중요한 연구 분야로 등장하고 있다. 본 논문에서는 효율적인 변화 탐지를 위한 데이터 구조로 X-tree와 이에 기초한 휴리스틱 변화 탐지 알고리즘 X-tree Diff 를 제안한다. X-tree Diff 는 X-tree 의 변화 내용에 대한 최소 비용 편집 스크립트를 찾는 알고리즘과는 달리 휴리스틱 트리 대응 알고리즘을 통해 병화 내용을 확인하는 알고리즘으로, X-tree 에 속한 모든 노드에 대해 각각의 노드를 루트로 하는 서브트리의 구조와 서브트리속에 속한 노드들의 데이터들을 128비트 해시값으로 표현한 값인 트리 MD를 각 노드에 저장하고, 이를 변화 탐지 과정에서 활용하여 신-구 버전의 X-tree들에 속한 서브트리들의 비교을 효율적으로 처리한다. X-tree Diff 는 4단계로 구성되며 1)신-구버넌의 X-tree노드들에 대해, 우선 1:1 대응이 가능한 모든 동등한 서브트리 쌍을 찾고, 2) 이들 서브트리 쌍의 루트로부터 신-구 버전의 X-tree의 루트까지의 경로 상에 존재하는 노드들에 대한 대응관계를 결정한다. 3) 그 후 신-구 버전의 X-tree의 루트들로부터 깊이 우선 탐색으로 노드를 방문하며 대응이 결정되지 않은 노드들에 대한 대응여부를 결정해 나간다. 4) 마지막까지 대응여부가 결정되지 않은 도드들은 삭제나 삽입된 것으로 간주한다. X-tree Diff XML 문서들에 대한 버저닝(Versioning) 을 목적으로 설계된 BUILD Diff 알고리즘과 달리 XML/HTML 에 공통적으로 사용할 수 있을 뿐 아니라, 알고리즘이 명확하고 간결하여 다양한 형태의 확장이 가능하다. 알고리즘의 성능도 개선되어 신-구 X-tree의 노드의 수를 n이라 할 때, O(n)의 시간 복잡도를 갖는다. 제안된 알고리즘은 현재 보안 관련 상용 시스템인 WIDS(Web-Document Instrusion Detection System) 에서 사용되고 있으며, 본 논문에서는 WIDS를 이용하여 20여개 신문-방송 사이트에서 변화가 탐지된 11,000 개 페이지에 대한 성능평가를 보이고 있다. We present X-tree Diff, a change detection algorithm for tree-structured data. Our work is motivated by need to monitor massive volume of web documents and detect suspicious changes, called defacement attack on web sites. From this context, our algorithm should be very efficient in speed and use of memory space. X-tree Diff uses a special ordered labeled tree, X-tree, to represent XML/HTML documents. X-tree nodes have a special field, tMD, which stores a 128-bit hash value representing the structure and data of subtrees, so match identical subtrees form the old and new versions. During this process, X-tree Diff uses the Rule of Delaying Ambiguous Matchings, implying that it perform exact matching where a node in the old version has one-to one corrspondence with the corresponding node in the new, by delaying all the others. It drastically reduces the possibility of wrong matchings. X-tree Diff propagates such exact matchings upwards in Step 2, and obtain more matchings downwsards from roots in Step 3. In step 4, nodes to ve inserted or deleted are decided, We aldo show thst X-tree Diff runs on O(n), woere n is the number of noses in X-trees, in worst case as well as in average case, This result is even better than that of BULD Diff algorithm, which is O(n log(n)) in worst case, We experimented X-tree Diff on reat data, which are about 11,000 home pages from about 20 wev sites, instead of synthetic documets manipulated for experimented for ex[erimentation. Currently, X-treeDiff algorithm is being used in a commeercial hacking detection system, called the WIDS(Web-Document Intrusion Detection System), which is to find changes occured in registered websites, and report suspicious changes to users." @default.
- W2007609084 created "2016-06-24" @default.
- W2007609084 creator A5023910049 @default.
- W2007609084 creator A5070423477 @default.
- W2007609084 date "2003-10-01" @default.
- W2007609084 modified "2023-09-26" @default.
- W2007609084 title "X-tree Diff: An Efficient Change Detection Algorithm for Tree-structured Data" @default.
- W2007609084 cites W1970026646 @default.
- W2007609084 cites W1975009259 @default.
- W2007609084 cites W1976373002 @default.
- W2007609084 cites W2024797550 @default.
- W2007609084 cites W2038246280 @default.
- W2007609084 cites W2048001624 @default.
- W2007609084 cites W2104972336 @default.
- W2007609084 cites W2130200371 @default.
- W2007609084 cites W2131310707 @default.
- W2007609084 cites W2136393336 @default.
- W2007609084 cites W2143275903 @default.
- W2007609084 cites W2145805921 @default.
- W2007609084 doi "https://doi.org/10.3745/kipstc.2003.10c.6.683" @default.
- W2007609084 hasPublicationYear "2003" @default.
- W2007609084 type Work @default.
- W2007609084 sameAs 2007609084 @default.
- W2007609084 citedByCount "0" @default.
- W2007609084 crossrefType "journal-article" @default.
- W2007609084 hasAuthorship W2007609084A5023910049 @default.
- W2007609084 hasAuthorship W2007609084A5070423477 @default.
- W2007609084 hasBestOaLocation W20076090841 @default.
- W2007609084 hasConcept C100560664 @default.
- W2007609084 hasConcept C105795698 @default.
- W2007609084 hasConcept C113174947 @default.
- W2007609084 hasConcept C11413529 @default.
- W2007609084 hasConcept C114614502 @default.
- W2007609084 hasConcept C125583679 @default.
- W2007609084 hasConcept C127413603 @default.
- W2007609084 hasConcept C151730666 @default.
- W2007609084 hasConcept C163797641 @default.
- W2007609084 hasConcept C165064840 @default.
- W2007609084 hasConcept C197855036 @default.
- W2007609084 hasConcept C207024777 @default.
- W2007609084 hasConcept C2779343474 @default.
- W2007609084 hasConcept C33923547 @default.
- W2007609084 hasConcept C38652104 @default.
- W2007609084 hasConcept C41008148 @default.
- W2007609084 hasConcept C62611344 @default.
- W2007609084 hasConcept C66938386 @default.
- W2007609084 hasConcept C68775195 @default.
- W2007609084 hasConcept C78669399 @default.
- W2007609084 hasConcept C80444323 @default.
- W2007609084 hasConcept C84927040 @default.
- W2007609084 hasConcept C86803240 @default.
- W2007609084 hasConcept C94557470 @default.
- W2007609084 hasConcept C99138194 @default.
- W2007609084 hasConceptScore W2007609084C100560664 @default.
- W2007609084 hasConceptScore W2007609084C105795698 @default.
- W2007609084 hasConceptScore W2007609084C113174947 @default.
- W2007609084 hasConceptScore W2007609084C11413529 @default.
- W2007609084 hasConceptScore W2007609084C114614502 @default.
- W2007609084 hasConceptScore W2007609084C125583679 @default.
- W2007609084 hasConceptScore W2007609084C127413603 @default.
- W2007609084 hasConceptScore W2007609084C151730666 @default.
- W2007609084 hasConceptScore W2007609084C163797641 @default.
- W2007609084 hasConceptScore W2007609084C165064840 @default.
- W2007609084 hasConceptScore W2007609084C197855036 @default.
- W2007609084 hasConceptScore W2007609084C207024777 @default.
- W2007609084 hasConceptScore W2007609084C2779343474 @default.
- W2007609084 hasConceptScore W2007609084C33923547 @default.
- W2007609084 hasConceptScore W2007609084C38652104 @default.
- W2007609084 hasConceptScore W2007609084C41008148 @default.
- W2007609084 hasConceptScore W2007609084C62611344 @default.
- W2007609084 hasConceptScore W2007609084C66938386 @default.
- W2007609084 hasConceptScore W2007609084C68775195 @default.
- W2007609084 hasConceptScore W2007609084C78669399 @default.
- W2007609084 hasConceptScore W2007609084C80444323 @default.
- W2007609084 hasConceptScore W2007609084C84927040 @default.
- W2007609084 hasConceptScore W2007609084C86803240 @default.
- W2007609084 hasConceptScore W2007609084C94557470 @default.
- W2007609084 hasConceptScore W2007609084C99138194 @default.
- W2007609084 hasIssue "6" @default.
- W2007609084 hasLocation W20076090841 @default.
- W2007609084 hasOpenAccess W2007609084 @default.
- W2007609084 hasPrimaryLocation W20076090841 @default.
- W2007609084 hasRelatedWork W1494010234 @default.
- W2007609084 hasRelatedWork W1530106829 @default.
- W2007609084 hasRelatedWork W1543525280 @default.
- W2007609084 hasRelatedWork W1967960833 @default.
- W2007609084 hasRelatedWork W2006131099 @default.
- W2007609084 hasRelatedWork W2010317435 @default.
- W2007609084 hasRelatedWork W2044821359 @default.
- W2007609084 hasRelatedWork W2044936698 @default.
- W2007609084 hasRelatedWork W2086808077 @default.
- W2007609084 hasRelatedWork W2088519218 @default.
- W2007609084 hasRelatedWork W2090733145 @default.
- W2007609084 hasRelatedWork W2113664030 @default.
- W2007609084 hasRelatedWork W2127915079 @default.
- W2007609084 hasRelatedWork W2149235116 @default.
- W2007609084 hasRelatedWork W2464844125 @default.
- W2007609084 hasRelatedWork W2768185942 @default.