Skip to content

RSS HTML 수집기 설계 및 구현 #22

@goinhacker

Description

@goinhacker

요구사항:
RSS 피드로 업데이트 되는 링크의 HTML을 수집하는 방법을 연구하고 설계 합니다.

모니터링할 RSS 피드는 이미 SourceData DB에 있다고 가정합니다.

  1. HTML 수집기에서는 RSS 피드로 새로운 컨텐츠가 올라오면 이를 인지해야합니다.
  2. 새로운 콘텐츠에서 oz 태그 등을 추출할 수 있는 HTML을 얻습니다.(oz태그 대신 썸네일 등이 있을수도 있음)
  3. HTML을 RSS 파서에 넘깁니다.

Metadata

Metadata

Assignees

Labels

Type

No type

Projects

No projects

Milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions