연구 데이터 관리는 연구를 할 때 데이터를 어떻게 저장하고 공유할 것인지에 대한 계획입니다. 데이터 관리 계획(DMP), 프로세스, 장기 보관 및 공유가 포함됩니다. 연구 데이터는 연구데이터 수집 지침에 따라 정의됩니다. 공개 데이터는 보안 규정과 기관 규정에 따라 선별됩니다.
연구 데이터 관리의 목표는 데이터를 장기적으로 접근하고 재사용할 수 있게 하는 것입니다. 연구 데이터 관리는 데이터 보안, 통합, 큐레이션, 거버넌스, 백업, 공유, 저장소, 아카이빙과 같은 중요한 측면을 다룹니다.
핵심 요약
- 대부분의 연구데이터는 개인 또는 소규모 연구실에서 관리되어왔습니다.
- 국가연구개발사업 데이터는 국가적으로 관리될 예정입니다.
- 연구데이터 공유의 중요성이 강조되고 있습니다.
- FAIR 원칙 등 국제 표준이 발표되었습니다.
- 체계적인 데이터 관리 절차와 IT 인프라가 필요합니다.
연구 데이터 관리의 정의와 중요성
연구 데이터는 관찰, 실험, 조사 등을 통해 얻은 정보입니다. 이 정보는 연구 성과를 재현하고 검증하는 데 중요합니다. 연구 데이터는 원천 데이터와 메타데이터로 구성됩니다. 메타데이터는 데이터에 대한 정보를 제공하며, 데이터 관리와 공유에 필수적입니다.
연구 데이터의 정의
연구 데이터는 관찰, 실험, 조사, 분석을 통해 얻은 정보입니다. 이 데이터는 연구 결과를 재현하고 검증하는 데 필수적입니다. 원천 데이터와 함께, 데이터에 대한 정보를 담은 메타데이터가 포함됩니다.
연구 데이터 관리의 필요성과 중요성
전 세계적으로 데이터 집중형 연구가 증가하고 있습니다. 연구 데이터 관리와 공유의 중요성이 높아지고 있습니다. 오픈 사이언스와 오픈 액세스 운동으로 연구 데이터와 결과물의 공개가 확산되고 있습니다.
이러한 공개는 연구자 간 협력을 강화하고 발전적 연구를 도모합니다. 데이터 재활용으로 중복 투자와 비용을 줄일 수 있습니다. 미래 연구에 집중할 수 있습니다.
“연구 데이터의 완전성은 신뢰성과 정확성을 의미하며, 높은 기준의 개방성과 투명성을 갖추는 것이 중요합니다.”
한국에서도 연구 데이터 관리가 중요합니다. 연구 데이터 관리 기준과 지침을 수립할 필요가 있습니다. 데이터의 수집, 접근, 공유, 장기 보존을 체계화할 필요가 있습니다.
이러한 노력으로 연구 데이터의 가치를 높이고 활용성을 극대화할 수 있습니다.
연구 데이터 생애주기
연구 데이터는 연구 활동의 전 과정에서 생성됩니다. 새로운 과학적 사실을 발견하고, 이를 분석하여 논문을 작성합니다. 이 논문은 출판될 수 있습니다.
이렇게 생성된 데이터는 다른 연구자의 인용 등을 통해 연구가 확산될 수 있습니다.
연구 데이터는 관찰, 측정, 실험 등을 통해 생산됩니다. 논문이나 보고서의 근거 자료로 활용될 수 있습니다. 연구 데이터 관리의 범위에는 소규모 Long Tail Data와 대규모 원천 데이터 및 메타데이터가 포함됩니다.
교육 프로그램 | 내용 |
---|---|
Coursera의 ‘연구데이터관리와 공유’ | 연구데이터관리에 대한 이론적, 제도적 논의와 좋은 데이터 관리 방법을 다룹니다. |
Data Curation Network의 ‘CURATED’ | 7단계의 체계적인 데이터큐레이팅 과정을 다루는 교육 프로그램입니다. |
이처럼 데이터 생애주기 모형은 연구 데이터의 체계적인 관리를 위한 개념적 틀로 활용됩니다. 또한 다양한 연구 서비스 지원을 위한 개념적 모형으로도 활용될 수 있습니다.
FAIR 데이터 원칙
FAIR 데이터 원칙은 연구 데이터 관리와 공유를 위한 국제 표준입니다. 찾을 수 있음(Findable), 접근 가능함(Accessible), 상호운용 가능함(Interoperable), 재사용의 4가지 핵심 요소를 포함합니다. 이 원칙을 따르면, 데이터의 검색, 메타데이터 관리, 데이터 접근성, 데이터 보안 등이 개선됩니다.
Findable (찾을 수 있는)
데이터의 찾을 수 있음은 메타데이터와 영구 식별자 사용으로 보장됩니다. 이로 인해 데이터를 쉽게 찾고 식별할 수 있습니다.
Accessible (접근 가능한)
접근 가능성은 데이터에 대한 접근을 표준 프로토콜을 통해 보장합니다. 데이터 접근이 불가능해도 메타데이터 접근은 허용되어야 합니다. 이로 인해 데이터 보안과 인증 체계를 유지할 수 있습니다.
Interoperable (상호운용 가능한)
상호운용성은 데이터가 다른 데이터와 표준 방식으로 연계될 수 있도록 합니다. 이를 통해 관련 정보에 대한 인용이 가능합니다.
Reusable (재사용 가능한)
재사용성은 데이터 라이선스와 프로비넌스 정보를 제공하여 재사용을 보장합니다. 이를 통해 데이터 출처와 처리 과정이 투명해지며, 신뢰성과 품질이 보장됩니다.
FAIR 데이터 원칙은 연구 데이터 관리와 공유를 위한 국제 표준입니다. 연구자들이 데이터를 더 효과적으로 검색, 접근, 상호운용, 재사용할 수 있도록 합니다.
연구 데이터 관리 체계 수립
연구기관은 데이터 관리 정책과 데이터 관리 절차를 만들었습니다. 이로 인해 연구데이터를 잘 관리할 수 있게 되었습니다. 한국지질자원연구원은 연구자의 책임 있는 연구를 위해 규정을 만들었습니다. 이 규정은 데이터 관리에 필요한 정책과 절차를 정의합니다.
또한, 데이터 관리 조직과 전문 인력을 만들었습니다. 이들은 연구데이터 관리와 활용을 지원합니다. 연구데이터 담당부서는 정책 수립, 관리체계 구축, 품질관리, 보안, 개방 및 활용 지원을 합니다.
연구기관은 연구데이터 관리를 위한 정책과 절차를 만들었습니다. 또한, 전담 조직과 인력을 구성하여 데이터 관리와 활용을 도모하고 있습니다.
연구 데이터 관리
연구 데이터 관리는 연구 프로세스의 핵심입니다. 연구자는 체계적인 계획에 따라 데이터를 수집하고 메타데이터를 작성합니다. 수집된 데이터는 표준을 따라 안전하게 저장됩니다. 데이터 손실 방지를 위해 단기 보존 계획이 세워집니다.
데이터의 무결성, 신뢰성, 가용성을 보장하기 위해 데이터 품질관리 활동이 중요합니다. 데이터 백업과 보안 조치가 이행됩니다. 이로 인해 연구의 효율성과 신뢰성이 높아집니다.
“체계적인 연구 데이터 관리는 연구 프로세스의 효율성과 투명성을 높이는 핵심 요소입니다.” – 한국연구데이터관리협의회
- 데이터 수집 및 메타데이터 작성
- 데이터 저장 및 단기 보존 계획 수립
- 데이터 품질관리 활동 수행
- 데이터 백업 및 보안 조치 이행
연구 데이터 접근 및 활용
연구 데이터의 가치를 높이는 것은 중요합니다. 데이터 접근 관리는 인증 절차와 데이터 공개 수준 조절을 포함합니다. 이로 인해 개인정보 보호와 기밀성이 유지됩니다.
접근 권한 및 인증
연구 데이터 접근은 사용자 인증 절차를 거쳐야 합니다. 연구자는 데이터의 공개 수준을 조절하여 접근을 제어할 수 있습니다. 이렇게 하면 데이터 활용의 효율성을 높일 수 있습니다.
데이터 분석 및 시각화
접근 권한이 있는 연구자들은 데이터 분석과 시각화를 할 수 있습니다. 데이터를 검색, 분석, 시각화하여 가치를 높일 수 있습니다. 새로운 통찰력과 발견을 통해 연구 성과를 개선할 수 있습니다.
데이터 접근 관리 기능 | 데이터 활용 기능 |
---|---|
사용자 인증 | 데이터 검색 |
데이터 공개 수준 관리 | 데이터 분석 |
개인정보 및 기밀성 보호 | 데이터 시각화 |
“연구 데이터에 대한 체계적인 접근 관리와 활용은 데이터의 가치를 높이고 연구 성과를 향상시키는 데 핵심적인 역할을 합니다.”
연구 데이터 보존
연구 데이터를 장기적으로 관리하고 보존하는 것은 매우 중요합니다. 이는 연구의 진정성과 재현성을 보장합니다. 이를 위해 체계적인 장기 보존 계획과 데이터에 대한 정확한 메타데이터 작성이 필수적입니다.
장기 보존 계획
장기적으로 데이터를 보존하기 위해서는 몇 가지 중요한 점을 고려해야 합니다:
- 보존할 데이터 결정: 연구 과정에서 생산된 데이터 중 장기적으로 보존해야 할 데이터를 선별합니다.
- 보존 위치 및 방법 선정: 데이터를 안전하게 보관할 수 있는 장소를 마련하고, 백업 및 복구 절차를 수립합니다.
- 메타데이터 작성: 데이터의 맥락 정보를 기록하여 향후 데이터 활용과 관리에 활용할 수 있도록 합니다.
보존 메타데이터 작성
연구 데이터를 장기적으로 보존하기 위해서는 보존 메타데이터를 작성합니다. 이 메타데이터는 데이터셋 및 프로젝트에 대한 정보를 포함합니다. 이를 통해 데이터의 이유, 사용자, 시기, 위치, 방법 등의 정보를 파악할 수 있습니다.
“연구데이터 관리는 연구 진실성과 효율성을 높이는 데 필수적입니다. 데이터의 장기적인 보존과 메타데이터 작성은 향후 데이터의 활용성과 재사용성을 높일 수 있는 핵심 요소입니다.”
연구 데이터 공유 및 재사용
연구 데이터를 공유하고 재사용하는 것은 중요합니다. 데이터셋과 프로젝트에 대한 기술이 필요합니다. 이를 통해 데이터 출처, 이력, 사용 내역이 데이터 인용이 가능해집니다.
데이터에 영구 식별자(DOI, IGSN)를 부여하면 데이터 출판도 가능합니다. 공개 가능한 연구 데이터 포털을 통해 오픈 데이터로 출판할 수 있습니다. 이로 인해 데이터 공유와 활용이 촉진됩니다.
데이터 인용
연구 데이터의 인용은 투명성과 재현성을 높입니다. 논문에 공개된 데이터는 유사 주제 논문보다 9%~30% 더 많이 인용됩니다.
오픈 데이터 출판
연구 데이터 공개는 재사용성을 높입니다. 필요에 따라 연구 결과를 검증할 수 있습니다. 데이터관리계획을 통해 연구비 지원 요건을 충족할 수 있습니다.
“DataWorks는 FAIR(이해 가능한, 안전한, 상호 운용성이 높은, 재사용 가능한) 데이터를 제공해 데이터의 사용성과 영향력을 향상시킵니다.”
결론
연구 데이터 관리는 데이터를 만들고 보존, 공유, 재사용하는 과정입니다. FAIR 데이터 원칙을 따라 데이터를 잘 관리하고 공유하는 것이 중요합니다.
현재 국내에서는 연구 데이터 관리에 대한 제도와 인력이 부족합니다. 하지만 정부와 연구기관은 데이터 관리와 공유를 도와주는 노력을 하고 있습니다. 이 노력으로 국내 연구 환경에 좋은 데이터 관리 체계를 만들 수 있을 것입니다.
데이터 공유와 재사용이 늘어나면 연구의 투명성과 신뢰성이 높아집니다. 연구 성과의 확산과 활용도도 증가합니다. 이에 대한 노력은 연구자, 연구기관, 정부 모두가 필요합니다.
FAQ
연구 데이터 관리란 무엇인가요?
연구 데이터 관리는 연구 프로젝트에서 데이터를 저장, 공유, 접근, 보존하는 방법입니다. 데이터 관리 계획(DMP), 프로세스, 장기 보관 및 공유도 포함됩니다.
연구 데이터의 정의는 무엇인가요?
연구 데이터는 관찰, 실험, 조사 등을 통해 얻은 자료입니다. 이 데이터는 연구 성과를 재현하는 데 필수적입니다. 데이터는 메타데이터와 원천 데이터로 구성됩니다.
연구 데이터 관리의 중요성은 무엇인가요?
데이터 집중형 연구가 증가하면서, 데이터 관리의 중요성이 높아졌습니다. 데이터 공유로 연구자 및 기관 평판 높이고, 발전적 연구 가능합니다. 데이터 중복 생산 비용도 줄어듭니다.
FAIR 데이터 원칙이란 무엇인가요?
FAIR 데이터 원칙은 연구 데이터 관리를 위한 국제 표준입니다. Findable, Accessible, Interoperable, Reusable의 4가지 항목으로 구성됩니다. 데이터를 쉽게 찾고, 표준화된 접근을 보장하며, 재사용을 보장합니다.
연구기관의 연구 데이터 관리 체계는 어떻게 구축되나요?
연구기관은 정책과 절차를 수립합니다. 전문 인력을 충원하여 담당부서를 구성합니다. 데이터 관리 정책, 관리체계, 품질관리, 보안, 개방 및 활용 지원 역할을 합니다.
연구 데이터 관리 프로세스는 어떻게 진행되나요?
연구자는 데이터를 수집하고 메타데이터를 작성합니다. 데이터는 안전하게 저장됩니다. 데이터 손실 방지, 품질관리, 백업 및 보안 조치가 이루어집니다. 데이터 접근은 지정된 이용자와 재사용자에게 허용됩니다.
연구 데이터의 장기 보존은 어떻게 이루어지나요?
장기적인 관리와 보존을 위해 보존 계획이 수립됩니다. 보존할 데이터, 위치, 도큐멘테이션 등이 결정됩니다. 메타데이터와 함께 데이터가 관리됩니다.
연구 데이터의 공유와 재사용은 어떻게 이루어지나요?
데이터 공유와 재사용을 위해 데이터셋, 프로젝트 기술이 이루어집니다. 데이터에 영구 식별자가 부여되어 출판됩니다. 공개 가능한 데이터는 데이터 포털을 통해 출판됩니다.
소스 링크
- https://dataon.kisti.re.kr/data_mgnt_guideline_08.do
- https://dataon.kisti.re.kr/promVide/promVideList_R.do?mm=MENU00151&sm=MENU00152
- https://www.kipa.re.kr/cmm/fms/FileDown.do?atchFileId=FILE_000000000008142&fileSn=2
- https://repository.kisti.re.kr/bitstream/10580/8207/1/2017-74 연구데이터 이해와 관리.pdf
- http://oxygen.korea.ac.kr/index.files/policy/policyref/ressuppsystem/nas-resdata.pdf
- https://kossda.snu.ac.kr/news?id=1716
- https://dataon.kisti.re.kr/data_mgnt_guideline_09.do
- https://journal.kci.go.kr/liss/archive/articlePdf?artiId=ART001699850
- https://oak.go.kr/central/journallist/journaldetail.do?article_seq=23850
- https://www.geodata.kr/journal/view.php?number=65
- https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE11314503
- https://pal.assembly.go.kr/napal/lgsltpa/lgsltpaOngoing/view.do?lgsltPaId=PRC_P2Y4Y0W7X0V3U1U4K2L2J2K7I1G0H3
- https://repository.kihasa.re.kr/bitstream/201002/36051/1/2020.8.No.286.02.pdf
- https://curation.dgist.ac.kr/curation/w/1555
- https://libguide.snu.ac.kr/c.php?g=965947&p=7017824
- https://grant-documents.thevc.kr/214473_첨부2. DMP 연구데이터 관리계획.pdf
- https://www.kistep.re.kr/boardDownload.es?bid=0031&list_no=43178&seq=1
- https://dataon.kisti.re.kr/data_mgnt_guideline_02.do
- https://starlibrary.org/research-data-management
- https://www.kistep.re.kr/boardDownload.es?bid=0031&list_no=93455&seq=1
- https://dataworks.argonet.co.kr/info/about/
- https://accesson.kr/jksarm/assets/pdf/10060/journal-21-4-137.pdf
- https://blog.genoglobe.com/2024/07/blog-post_12.html
- https://koreascience.kr/article/JAKO202018955008023.page