정보기술이 발전하면서 데이터가 많이 늘어났습니다. 데이터는 사회를 이해하고 미래를 예측하는 데 중요합니다. 데이터와 기술의 발전은 새로운 정책을 필요로 합니다.
오픈 사이언스 운동은 공공 자금으로 연구 결과를 활용하는 필요성을 높였습니다. 이 글에서는 한국의 연구 데이터 관리와 공유 정책을 살펴보겠습니다.
주요 요점
- 연구 데이터 관리와 공유의 중요성 증가
- 오픈 사이언스와 데이터 공유 필요성 부각
- 연구 데이터 관리 체계 수립의 필요성
- 데이터 표준화와 메타데이터 작성의 중요성
- 연구 데이터 공유와 활용을 위한 방안 모색
연구 데이터의 중요성과 오픈 사이언스
오늘날 연구자들은 많은 데이터를 수집하고 활용합니다. 이들은 정보와 지식을 만들고 있습니다. 데이터 중심 연구와 근거 기반 정책의 중요성이 커지고 있습니다. 그래서 전 세계적으로 오픈 사이언스 운동이 성장하고 있습니다.
데이터가 연구에서 차지하는 중요성 증대
연구자들은 데이터를 통해 연구 결과를 투명하게 만들고 재현할 수 있습니다. 이를 통해 국가적 차원에서 효율적인 연구 자금 지원과 근거 기반 정책이 가능해집니다.
오픈 사이언스와 연구 데이터 공유의 필요성
오픈 사이언스는 사회경제적 편익을 높이기 위해 연구 성과물을 공개하는 노력입니다. 연구 데이터의 투명성과 활용성을 높이기 위해 데이터 공유가 중요합니다. 이렇게 하면 연구자 간 협력이 늘고, 연구의 영향력과 인용도가 높아질 수 있습니다.
결과적으로, 데이터 중심 연구와 근거 기반 정책, 그리고 오픈 사이언스의 중요성이 증가하고 있습니다. 체계적인 연구 데이터 관리와 공유를 통해 국가 자원을 효율적으로 사용할 수 있습니다.
연구 데이터 관리의 정의와 원칙
연구 데이터는 국가연구개발사업에서 만들어진 자료입니다. 이 데이터는 연구 성과를 재현하는 데 필수적입니다. 연구 데이터 관리는 FAIR(Findable, Accessible, Interoperable, Reusable) 원칙에 따라야 합니다.
FAIR 원칙은 데이터를 검색 가능하고(Findable), 접근 가능하며(Accessible), 상호 운용 가능하고(Interoperable), 재사용 가능하도록(Reusable) 하도록 합니다. 이로 인해 데이터의 가치가 높아지고, 연구 활동의 투명성과 재현성이 개선됩니다.
- 데이터 검색 가능성: 메타데이터 정의와 표준화를 통해 데이터를 쉽게 찾을 수 있어야 합니다.
- 데이터 접근성: 데이터 저장소에 저장하여 관리하고, 인증 절차를 거쳐 접근할 수 있도록 해야 합니다.
- 데이터 상호운용성: 개방형 데이터 형식과 언어를 활용하여 다양한 시스템 간 데이터 교환이 가능해야 합니다.
- 데이터 재사용성: 데이터 사용 조건과 라이선스를 명시하여 재사용이 용이하도록 해야 합니다.
FAIR 원칙 | 설명 |
---|---|
Findable | 데이터를 쉽게 찾을 수 있도록 메타데이터 정의와 표준화 |
Accessible | 데이터 저장소에 저장하고 인증 절차를 거쳐 접근 가능 |
Interoperable | 개방형 데이터 형식과 언어를 활용하여 시스템 간 교환 가능 |
Reusable | 데이터 사용 조건과 라이선스를 명시하여 재사용 용이 |
“연구 데이터 관리는 데이터의 가치를 극대화하고, 협력적인 연구 활동을 촉진할 수 있는 핵심 요소입니다.”
국내 연구 데이터 관리 현황
2019년부터는 국가 R&D 사업에서 데이터 관리 계획(DMP)을 제출해야 합니다. 공공 연구 데이터 공유와 활용을 위한 정책과 인프라가 많이 만들어지고 있습니다. 하지만, 연구자들에게 다양한 지원이 필요합니다.
국내 연구 데이터 관리 현황을 자세히 보면, 최근 한 연구에서 22개 연구기관과 20개 대학을 조사했습니다. 이 조사에서는 연구 데이터의 생성, 관리, 활용, 공유에 대한 요구를 알아냈습니다. 특히, 경제인문사회계의 데이터 관리 체계가 미흡하다는 것이 밝혀졌습니다.
이 연구 결과는 국내 연구 데이터 관리의 문제를 보여줍니다. 오픈 사이언스와 데이터 공유의 중요성을 강조합니다. 향후, 경제인문사회계 연구 기관의 데이터 관리 역량을 강화하는 정책과 인프라가 필요할 것으로 보입니다.
경제인문사회계 연구 데이터 관리 체계 부족
국내 대학 연구자들을 조사한 결과, 인문사회계와 자연과학·공학·의학 분야 간 차이가 있었습니다. 대부분의 연구 프로젝트에서는 체계적인 데이터 관리 시스템이 없었습니다. 장기 데이터 보존과 메타데이터 작성에 대한 만족도도 낮았습니다.
- 약 80%의 응답자는 프로젝트 종료 후 10년 이내에 데이터가 유용하지 않다고 믿었습니다.
- 데이터 공유는 주로 연구팀 내부 또는 다른 연구자의 요청에 의해 이루어졌습니다. 데이터 재활용 비율이 더 높았습니다.
- 다른 연구자의 데이터는 주로 학술지 논문이나 개인적인 연락을 통해 얻었습니다.
이 결과는 경제인문사회계의 연구 데이터 관리와 공유 체계가 미흡하다는 것을 보여줍니다. 체계적인 데이터 관리 지원이 필요합니다.
연구 데이터 관리 체계 수립
연구 기관에서는 연구자가 책임 있는 연구를 할 수 있도록 해야 합니다. 또한, 연구 데이터를 잘 관리할 수 있는 방안을 마련해야 합니다.
정책 및 절차 수립
연구 데이터 관리를 위한 정책과 절차를 명확하게 수립해야 합니다. 이렇게 하면 연구자들이 연구 데이터를 전 생애 주기 동안 잘 관리할 수 있습니다. 정책에는 데이터 생성, 저장, 보안, 공유, 보존에 대한 지침이 포함되어야 합니다.
전담 조직 및 인력 확보
연구 데이터 관리를 위한 조직과 전문 인력을 확보해야 합니다. 이들은 연구자들을 지원하여 정책과 절차를 잘 따를 수 있도록 돕습니다. 또한, 데이터의 보안과 접근성을 관리합니다.
연구 기관은 연구 데이터 관리 체계를 수립함으로써 연구의 책임성과 투명성을 높일 수 있습니다. 또한, 연구 데이터의 가치를 극대화할 수 있습니다.
연구 데이터 수집 및 저장
연구 활동을 통해 만들어진 연구 데이터는 관리와 보존을 위해 데이터 리포지토리에 제출해야 합니다. 연구 데이터는 기관 기준에 맞게 정제되고 표준화되어야 합니다. 또한, 데이터 활용을 위해 풍부한 메타데이터를 작성해야 합니다.
연구데이터 정제 및 표준화
디지털 기술의 발전으로 방대한 연구 데이터가 만들어지고 있습니다. 새로운 연구 영역을 개척하는 동시에 데이터 관리와 가공 과정에서 오류가 발생할 수 있습니다. 따라서, 연구원들은 연구 데이터의 완전성을 확보하기 위해 전문적 기준에 따라 데이터 정제 및 표준화 작업을 수행해야 합니다.
메타데이터 작성
연구 데이터의 효과적인 관리와 활용을 위해 메타데이터 작성이 필수적입니다. 연구 기관 및 지원 기관은 데이터 보존 가치 판단과 보존 기간 산정을 통해 관리 및 접근 정책을 수립해야 합니다. 연구원들은 이를 준수하며 데이터 주석과 보존 정책 개발에 참여해야 합니다.
항목 | 내용 |
---|---|
연구책임자 | 홍길동 |
총연구개발기간 | 2019.04.01 ~ 2021.12.31 |
총 정부지원연구개발비 | 당해(’21년) – 1,500 백만원, 전년도(’20년) – 500 백만원 |
연구데이터 파일 포맷 | Hierarchical Data Format(HDF) |
연구데이터 저장 및 보존 방안 | 지속적인 HDF 라이브러리 보존, 데모 소프트웨어는 SourceForge.org 사이트에 지속적 보존 |
공동활용 가능한 연구데이터 종류 | SW, 소스코드 |
연구데이터 공개 · 공유 시점 | 연구 종료 후 3 개월 이내 공개 SW 결과물(소스코드 등)을 공개 SW 포털(www.oss.kr)에 업로드 |
연구데이터의 공유 제한 사항 | GPL v.3에 근거한 오픈소스인 데모 소프트웨어는 무료로 제공, HDF 파일 모음에 대한 메타데이터에 권장되는 인용방법 기술 |
“연구데이터 관리를 통해 데이터의 완전성, 접근성, 관리성을 확보하기 위한 정책과 권고안들이 제시되고 있습니다.”
연구 데이터 출판
연구 결과물을 온라인으로 공개하는 것이 연구 데이터 출판입니다. 이 과정에서 데이터 품질 검증과 메타데이터 작성이 중요합니다.
데이터 출판 절차
연구 데이터를 출판하려면 몇 단계를 거칩니다:
- 데이터 정제 및 표준화
- 메타데이터 작성
- 데이터 제출 및 품질 검토
- 데이터 공개 및 공유
데이터 식별자 부여
DOI(Digital Object Identifier)를 데이터에 부여하면 출처와 활용을 추적할 수 있습니다. DOI를 사용하면 데이터를 쉽게 찾고, 접근할 수 있게 합니다.
데이터 형태 | 비율 |
---|---|
실험 데이터 | 50% |
계산 데이터 | 50% |
연구 데이터를 출판하면 다른 연구자들이 쉽게 재활용할 수 있습니다. 이는 연구의 투명성과 생산성을 높이고, 과학 발전에 기여합니다.
연구 데이터 관리
연구 데이터 관리는 연구의 투명성과 재현성을 높이는 데 중요합니다. 연구 데이터 수집, 저장, 출판, 공유, 활용을 포함합니다. 이로 인해 연구 데이터의 안정적인 보존과 다른 연구자들의 활용이 지원됩니다.
국내에서는 KISTI(한국과학기술정보연구원)가 운영하는 데이터 관리 계획(DMP) 사이트가 시범운영 중입니다. 연구기관들이 자체적인 데이터 관리 체계를 수립하고 있습니다. 이를 통해 연구 데이터의 정제, 표준화, 메타데이터 작성 등 체계적인 관리와 공유를 지원합니다.
figshare, re3data, DataCite 등 다양한 국내외 연구 데이터 저장소와 식별자 부여 서비스를 활용합니다. 이를 통해 연구 데이터의 체계적인 관리와 공유를 도모합니다.
체계적인 데이터 관리를 위해 연구기관 차원에서 데이터 관리 정책과 절차 수립이 필요합니다. 전담 조직 및 전문 인력 확보, 연구자 대상의 교육 및 지원도 필요합니다.
연구 데이터 공유 및 활용
연구 기관들은 표준 프로토콜을 따라 데이터를 관리하고 배포해야 합니다. 이를 통해 연구 데이터의 활용도를 높일 수 있습니다. 또한, 다양한 연구 환경을 제공함으로써 연구 데이터의 활용도를 높일 수 있습니다.
연구데이터 접근 및 공유
연구 분야에서 데이터의 중요성이 커지고 있습니다. 따라서, 연구데이터의 접근성 및 공유가 중요해졌습니다. 연구 기관들은 연구자들이 데이터에 쉽게 접근하고 활용할 수 있도록 노력하고 있습니다.
- 국내 주요 연구 기관들은 연구데이터 플랫폼을 만들었습니다. 이로 인해 연구데이터의 공유와 활용이 촉진됩니다.
- 이러한 플랫폼 덕분에 연구자들은 필요한 데이터를 쉽게 찾고 활용할 수 있게 되었습니다.
- 이 노력은 연구데이터의 접근성과 활용성을 높이는 데 기여하고 있습니다.
연구데이터 활용
연구데이터의 공유와 활용이 늘어남에 따라, 연구자들의 데이터 활용 역량이 중요해졌습니다. 연구 기관들은 다양한 방식으로 연구데이터의 활용을 지원합니다.
- 데이터 처리 및 분석 도구를 제공합니다.
- 데이터 활용 교육과 컨설팅을 실시합니다.
- 데이터 분석 전문가의 지원을 받을 수 있습니다.
결론
한국의 연구 데이터 관리 정책은 점점 더 중요해지고 있습니다. 연구 기관들은 데이터 관리와 활용을 위해 정책을 만들고, 전담 팀을 구성해야 합니다. 데이터 정리와 표준화, 메타데이터 작성도 필수입니다.
이렇게 하면 연구 데이터를 공유하고 활용할 수 있습니다. 새로운 지식과 가치를 창출할 수 있습니다.
최근 국내에서는 연구 데이터 관리 법률이 논의 중입니다. 공공데이터법과 산업 디지털 전환법의 역할을 구분하고 있습니다. DataON과 NaRDA 같은 인프라도 발전하고 있습니다.
연구 데이터 공유를 촉진하기 위해 정책적 지원이 필요합니다. 데이터 공개가 성과를 창출하는지 분석하는 체계도 필요합니다. 이렇게 하면 연구자들의 데이터 공유 동기를 높일 수 있습니다.
FAQ
데이터 중심 연구와 근거 기반 정책의 중요성은 무엇인가요?
오픈 사이언스란 무엇이며, 연구 데이터 공유의 필요성은 무엇인가요?
연구 데이터 관리의 정의와 주요 원칙은 무엇인가요?
국내 경제인문사회계 연구 기관의 연구 데이터 관리 현황은 어떠한가요?
연구 기관에서 연구 데이터 관리 체계를 수립하려면 어떤 노력이 필요한가요?
연구 데이터는 어떻게 수집 및 저장되며, 메타데이터는 어떻게 작성해야 하나요?
연구 데이터 출판은 어떤 절차로 진행되며, 데이터 식별자 부여의 의의는 무엇인가요?
연구 데이터 관리는 어떤 과정으로 이루어지나요?
연구 데이터 공유 및 활용을 위해 어떤 노력이 필요한가요?
소스 링크
- https://pal.assembly.go.kr/napal/lgsltpa/lgsltpaOngoing/view.do?lgsltPaId=PRC_P2Y4Y0W7X0V3U1U4K2L2J2K7I1G0H3
- https://data.kigam.re.kr/manage/data/guide?lang=ko
- https://scent.kisti.re.kr/site/main/archive/article/과학향기-story-과학기술-발전의-핵심-연구데이터
- https://repository.kihasa.re.kr/bitstream/201002/36051/1/2020.8.No.286.02.pdf
- https://dataon.kisti.re.kr/data_mgnt_guideline_07.do
- https://blog.naver.com/with_msip/223250490669
- https://www.kistep.re.kr/boardDownload.es?bid=0031&list_no=43178&seq=1
- https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE09360947
- http://koreascience.or.kr/article/JAKO201708034061047.page
- https://www.kci.go.kr/kciportal/landing/article.kci?arti_id=ART001699850
- https://accesson.kr/jksarm/assets/pdf/1393/journal-18-1-101.pdf
- http://oxygen.korea.ac.kr/index.files/policy/policyref/ressuppsystem/nas-resdata.pdf
- https://grant-documents.thevc.kr/206141_붙임4-5. (연구데이터 공개대상과제) 연구데이터 관리계획.pdf
- https://curation.dgist.ac.kr/curation/w/1555
- https://dataon.kisti.re.kr/data_mgnt_guideline_01.do
- https://starlibrary.org/research-data-management
- https://grant-documents.thevc.kr/214473_첨부2. DMP 연구데이터 관리계획.pdf
- https://libguide.snu.ac.kr/c.php?g=965947&p=7017824
- https://fliphtml5.com/lukuo/vosz/혁신성장_촉진을_위한_연구데이터_공유_활용_전략(안)/
- https://www.nkis.re.kr/subject_view1.do?otpId=OTP_0000000000006691&otpSeq=0&popup=P
- https://accesson.kr/kslis/v.58/2/151/42703
- https://repository.kisti.re.kr/bitstream/10580/8207/1/2017-74 연구데이터 이해와 관리.pdf
- https://blog.genoglobe.com/2024/07/blog-post_12.html
- https://www.slideshare.net/slideshow/dmp-part04/78879011