fnctId=thesis,fnctNo=318
사회과학 연구자의 연구데이터관리 요구 분석 : 데이터 생애주기를 중심으로
- 링크
- https://www.riss.kr/link?id=T16857043
- 작성자
- 조지은
- 저자
- 송민건
- 발행사항
- 부산 : 부산대학교 대학원, 2023
- 발행일
- 2023.08.
- 국문초록
- 코로나바이러스-19의 영향으로 연구성과와 과정을 개방화하는 오픈사이언스(Open Science) 정책 도입이 가속화되고 있다. 해외 주요 선진국들은 연구데이터관리와 공유를 포함한 오픈사이언스 정책을 적극적으로 추진하고 있다. 오픈사이언스가 실현되기 위해서는 연구 성과물을 누구나 접근하여 재사용할 수 있도록 하는 것이 중요하며, 이는 연구 결과로 얻은 성과물뿐 아니라 연구 과정과 출판 과정에서 사용되거나 산출된 연구데이터를 포함한 전 연구 과정이 투명하게 공개되어야 함을 의미한다. 연구 과정의 공개는 연구데이터를 공개하는 ‘오픈데이터’를 통해 추진되고 있으며, 연구데이터관리는 이러한 오픈데이터를 실현하기 위한 필수 요소로서, 오픈사이언스의 핵심 개념 중 하나이다.
국내에서도 오픈 사이언스와 연구데이터관리를 위한 다양한 논의를 통해 제도들을 도입하고 있음에도 불구하고 여전히 연구데이터관리에 대한 국내의 인식은 부족하다. 특히 그 중에서도 과학기술 분야를 중심으로 논의가 전개되고 있어 사회과학 분야의 연구데이터관리에 대한 논의나 연구는 매우 부족하다. 연구데이터의 특성상 해당 연구 분야에 의존적인 성격으로 범용적인 연구데이터관리보다는 특정 학문 분야를 위한 연구데이터관리가 필요하다.
이에 본 연구에서는 사회과학 분야 연구자의 데이터 생애주기에 따른 연구데이터관리 요구사항을 파악하여 사회과학 분야의 특성에 맞는 연구데이터관리 방안을 제시하기 위한 기초자료를 제시하는 것을 목표로 하였다. 이를 위하여 문헌 조사를 통해 국내외에서 사회과학 분야에 특화하여 연구데이터관리를 제공하는 CESSDA, UK Data Service, ICPSR, KOSSDA 총 4개 기관에서 제시한 데이터 생애주기 단계를 파악하여 재정리하였다. 이 연구에서 활용한 데이터 생애주기는 1. 데이터관리계획, 2. 연구데이터 조직, 3. 연구데이터 수집, 4. 연구데이터 분석, 5. 연구데이터 저장 및 보존, 6. 연구데이터 보호, 7. 연구데이터 출판, 공유, 8. 연구데이터 재이용 등 8단계이다.
문헌연구를 통해 정리한 8단계의 데이터 생애주기를 바탕으로 P 대학의 사회과학 분야 연구자 15명을 대상으로 심층면담을 수행하였다. 면담 내용은 참여자들의 동의를 받아 녹음하고 전사하여 질적 코딩 과정을 거쳐 분석하고 범주화하였다. 문헌연구를 통해 정리한 데이터 생애주기 단계를 대분류로 삼아 1차적으로 범주화하고, 각 단계별로 범주화된 코드를 세부 하위 분류로 추가로 범주화하였다. 이를 통해 사회과학 분야 연구자들의 연구데이터관리 요구사항을 8개의 대분류와 16개의 하위 분류로 정리하였다.
본 연구를 통해 파악한 연구 참가자들의 데이터 생애주기별 연구데이터관리 요구사항은 다음과 같다. 첫째, 국내 사회과학 분야는 DMP에 대한 인지도가 낮아, 연구자들이 DMP 작성 경험이 부족하다. 또한, DMP 양식이 사회과학 분야에 맞지 않아 개선이 필요하다. 둘째, 국내 사회과학 분야의 연구데이터관리를 위한 의무조항과 데이터 공유가 활성화되지 않아 연구자들의 메타데이터 작성이나 데이터 조직화가 제한적이다. 셋째, 국내 사회과학 분야는 공공데이터를 제외한 연구데이터의 재이용이 크게 활발하지 않았다. 그래서 연구자들은 연구를 진행할 때마다 연구데이터를 그때그때 수집해야 하는 어려움을 겪고 있었다. 넷째, 연구 참가자들은 다양한 프로그램을 사용하여 데이터를 분석하지만, 특정 프로그램을 활용하는 과정에서 사용 장소에 제약을 받는 등의 어려움을 겪고 있었다. 다섯째, 사회과학 분야는 특히 연구 참여자들의 기밀 유지와 민감정보 보호가 중요하며, 이를 위한 동의와 익명화 처리가 필요하다. 여섯째, 대용량 연구데이터 활용 시 저장 및 분석 과정에서 어려움을 겪고 있었다. 일곱째, 연구 참가자들은 연구데이터의 공유가 활성화되면 투명성 및 연구의 질이 개선될 것으로 기대하지만, 악용 가능성, 연구 주제 선점, 데이터 맹신, 연구 윤리 변화 등을 우려하였다. 여덟째, 연구 참가자들은 연구데이터 재이용 과정에서 데이터를 파악하고 접근하고 활용하는 과정에서 다양한 어려움이 있었다.
연구 결과를 바탕으로 국내 사회과학 분야의 연구데이터관리 활성화를 위한 몇가지 방안을 제안하였다. 국가적 차원에서는 첫째, 국가적인 차원에서 오픈사이언스와 연구데이터관리를 활성화하기 위한 정책과 제도를 논의하고 도입할 필요가 있다. 둘째, 연구자들이 자신이 생성한 연구데이터를 안심하고 공개할 수 있도록 국가적 차원에서 사회과학 분야 연구데이터 공유 시스템과 리포지터리를 구축하는 것이 필요하다. 셋째, 국가와 학계 차원에서 연구 윤리에 대한 논의를 통해 명확한 기준을 확립해야 한다.
연구데이터 리포지터리 차원에서는 첫째, 연구자들이 안심하고 데이터를 기탁할 수 있도록 다양한 기능을 도입할 필요가 있다. 둘째, 구축한 연구데이터를 사회과학 분야 연구자들이 잘 활용할 수 있도록 연구데이터 재이용 과정에서 필요로 하는 다양한 도움을 제공해야 한다.
대학도서관을 비롯한 연구지원기관에서는 첫째, DMP를 작성하거나 기관생명윤리위원회 심의에 필요한 서류를 작성하는 과정에서 생소함과 어려움을 겪는 연구자들을 위해, 작성 예시와 실습 교육을 제공할 필요가 있다. 둘째, 개인의 사생활을 침해할 우려가 있는 민감정보를 적절하게 처리하는 방법을 교육하고, 민감정보의 처리에 활용할 수 있는 도구나 소프트웨어를 안내하고 제공할 필요가 있다. 셋째, 연구데이터를 분석하는 데 필요한 프로그램과 장비를 지원할 필요가 있다. 넷째, 사회과학 분야 연구자들이 연구데이터 재이용 과정에서 필요로 하는 다양한 도움을 제공해야 한다.
본 연구는 사회과학 연구자들의 실제 연구 과정에서 발생하는 연구데이터관리에 대한 구체적인 요구사항을 데이터 생애주기를 바탕으로 파악하고 정리하여 제시하였다. 향후 지속적인 후속 연구를 통하여 구체적인 사회과학 분야 연구데이터관리 방안을 수립하고 이를 위한 적절한 지원이 제공될 수 있도록 해야 할 것이다.
- 영문초록
- Due to the COVID-19 pandemic, the introduction of open science policies to make research results and processes public has been accelerating. Many developed countries are actively promoting open science policies, including Research Data Management (RDM) and data sharing. For open science, it is important to ensure that anyone can access and reuse research results. Open science also extends transparency and access to the entire research process, including the data used or calculated in the process of research and publication. RDM is a key component of open science as an essential element for realizing access to open data and the research process.
While related systems are being introduced through various discussions for open science and RDM in Korea, domestic awareness of research data management is still low. Existing discussions are primarily focused on science and technology fields and there has been limited discussion or research on RDM in the social sciences. Research data is dependent on the type and field of research, so RDM plans for specific academic fields are needed rather than general RDM plans.
Accordingly, this study aimed to identify RDM requirements according to the data life cycle of researchers in the social sciences and to present RDM measures suitable for the social sciences due to the identifies needs and characteristics. For this, the data life cycle stages proposed by a total of four institutions (CESSDA, UK Data Service, ICPSR, and KOSSDA) which specialize in social science at Korea and abroad as well as related research literature were identified and reorganized. The research data life cycle used in this study consists of eight stages: 1) data management plan (DMP); 2) organize and document; 3) collect; 4) analyze; 5) store and preserve; 6) protect; 7) share and publish; and 8) access.
The aforementioned eight-stage data lifecycle was used to guide in-depth interviews with 15 researchers working in social science fields at P University. The contents of the interviews were recorded and transcribed with the consent of the participants. The interview data was analyzed and categorized through a qualitative coding process using the eight-stage data life cycle as a framework. The data was first categorized into large categories, and the codes categorized for each stage were further categorized into detailed sub-classifications. Through this, the research data management requirements of researchers in the social sciences were organized into 8 major categories and 16 sub-categories.
The RDM requirements for each data lifecycle of research participants identified through this study are as follows. First, the social science researchers in Korea had low awareness of and experience with writing DMP. In addition, participants found that existing DMP styles are not suitable for the field of social science. Second, due to the lack of mandatory provisions and data sharing for RDM in the social sciences in Korea, researchers' metadata creation and data organization practices are limited. Third, the reuse of research data other than public data was not very active in the social science fields in Korea and researchers had difficulty accessing other forms of secondary data. Fourth, study participants analyzed data using various programs, but they experienced difficulties such as being geographic restrictions on the use of some specific research tools. Fifth, in the social sciences, participants noted the importance to maintain confidentiality and protect sensitive information of their research participants, and informed consent and anonymization are needed for this. Sixth, participants reported difficulties in storing and analyzing large-capacity research data or big data sets. Seventh, study participants expected that the sharing of research data would improve transparency and research quality, but they were concerned about the possibility of abuse, co-opting of research topics, reusing data without considering its original use and collection contexts, and changes in research ethics. Eighth, study participants had various difficulties in identifying, accessing, and utilizing data in the process of reusing research data.
Based on the results of the study, several measures were proposed to revitalize RDMs in the social science fields in Korea. At the national level, first, it is necessary to discuss and introduce policies and systems to revitalize open science and RDM at the national level. Second, it is necessary to establish a research data sharing system and repository for the social sciences at the national level so that researchers can safely disclose the research data they have generated. Third, clear standards should be established through discussions on research ethics at the national and academic levels.
At the research data repository level, first, it is necessary to introduce various functions so that researchers can deposit data with confidence. Second, it is necessary to provide various help needed in the process of reusing research data so that researchers in the field of social science can use the established research data well.
For example, Research supporting institutions, such as universities, academic libraries, and research institutes, need to provide examples of writing and practical education for researchers who are unfamiliar or have difficulties in the process of writing DMPs or preparing documents necessary for deliberation by the human research review boards, such as Institutional Bioethics Committees or Institution Review Boards. Additionally, it is necessary to educate researchers on how to properly process sensitive information that may infringe on individual privacy, and to guide and provide tools or software that can be used to process sensitive information. Research supporting institutions should also support programs and equipment necessary to analyze research their own data as well as assistance in the process of re-using secondary data.
This study identified, organized, and presented specific requirements for RDMs based on the data life cycles of researchers working in the social sciences in Korea. In the future, it is necessary to establish specific RDM measures in the field of social science through continuous follow-up research and to provide appropriate support and training to support better RDM practices and open science more broadly.
- 일반텍스트
- 첨부파일