archivej keynote
슬라이드 1 / 9
keynote
archivej
흩어진 원본 저장소를 읽어, 검증 가능한 메타데이터와 웹 공개용 아카이브 페이지로 바꾸는 저장소-중심형 아카이브 제작 체계입니다.
보충 메모
저장소를 읽는 것에서 시작해, 웹에서 읽히는 아카이브까지 이어줍니다.
해결하는 문제
왜 archivej가 필요한가
핵심 항목
- 자료는 있는데 찾기 어렵습니다.
- 파일명과 폴더 구조만으로는 전체 맥락이 보이지 않습니다.
- PDF, 이미지, 텍스트가 섞이면 사람이 일일이 정리해야 합니다.
- 공개용 웹 아카이브를 만들 때마다 구조와 규칙이 달라집니다.
- 정리된 결과와 원본 사이의 추적 가능성이 약해집니다.
방식
archivej는 어떻게 작동하나
archivej는 먼저 storage를 기준점으로 삼습니다. 원본을 읽고, 그 위에 정리 규칙을 적용해, 웹에서 탐색 가능한 아이템 페이지와 안내 페이지를 만듭니다.
핵심 항목
- 원본 저장소를 읽는다.
- 파일 형식과 구조를 분류한다.
- OCR, 본문 추출, 요약, 태깅을 수행한다.
- 누락과 불일치를 검증한다.
- Hugo 기반 웹 아카이브로 출력한다.
- 연구 안내, 서비스 콘텐츠, 문서 페이지로 다시 설명한다.
특징
저장소 우선 구조
핵심 항목
- 원본을 먼저 읽고, 원본이 없는 결과물은 완성으로 보지 않습니다.
- 저장소와 웹 페이지의 대응 관계를 유지합니다.
- 삭제, 누락, 중복을 점검할 수 있습니다.
특징
문서와 미디어를 함께 다루는 파이프라인
핵심 항목
- PDF, 텍스트, 이미지, 구술 전사 파일을 같은 흐름으로 다룹니다.
- OCR이 필요한 자료는 텍스트를 추출해 본문으로 넣습니다.
- 설명 파일과 원본 파일을 함께 읽어 메타데이터를 보강합니다.
특징
자동 검증
핵심 항목
- 공개 여부, 설명 누락, 구조 불일치, 저장소 불일치를 검토합니다.
- 아이템과 원본의 차이를 확인할 수 있어 운영 리스크가 줄어듭니다.
문서 체계
탐색과 발행이 분리된 문서 체계
핵심 항목
- `research-guide.md`는 탐색용입니다.
- `service-contents.md`는 바로 발행 가능한 콘텐츠용입니다.
- `document.md`는 분석과 논증용입니다.
- 역할을 분리해 같은 자료를 서로 다른 목적에 맞게 활용할 수 있습니다.
가치
고객이 체감하는 가치
핵심 항목
- 자료를 찾는 시간이 줄어듭니다.
- 정리 기준이 문서화되어 인수인계가 쉬워집니다.
- 전시, 연구, 홍보, 교육에 같은 원본을 재사용할 수 있습니다.
- 원본과 공개본의 관계가 명확해져 운영 신뢰도가 높아집니다.
- 대규모 자료도 규칙 기반으로 꾸준히 확장할 수 있습니다.
한 줄 피치
archivej는 무엇인가
archivej는 저장소를 읽고, 검증하고, 설명하고, 웹으로 공개하는 아카이브 제작 엔진입니다.
보충 메모
발표의 마지막 장에서 이 한 문장만 남겨도 됩니다.
화살표 키나 버튼으로 슬라이드를 넘길 수 있습니다.