Appearance
7. 연구 환경ᆞ접속
연구 환경은 데이터 제공 신청이 승인된 이후, 연구자가 플랫폼 내에서 데이터 분석을 수행할 수 있도록 제공되는 독립적이며, 폐쇄적인 분석 공간입니다. 연구자는 연구환경을 통해 제공되는 소프트웨어를 비롯한 각종 도구를 사용하여 다양한 연구 활동을 수행할 수 있습니다.
시스템에서 생성한 코호트 및 승인된 연구 데이터는 연구 환경과 연계되어 활용할 수 있으며, 연구자는 연구 목적에 적합한 분석 환경을 선택하거나 새로운 소프트웨어의 설치를 요청하여 맞춤형 분석 환경을 구성할 수 있습니다

7.1 연구 환경 개요
연구 환경은 연구자가 승인된 데이터를 안전하고 효율적으로 분석할 수 있도록 제공되는 분석 전용 작업 공간입니다. 연구자는 별도의 소프트웨어 설치와 환경 설정 없이 제공되는 연구 환경에 접속하여 데이터 분석과 검증을 수행할 수 있습니다.
연구 환경은 데이터 보안 및 연구 재현성을 고려하여 구성되어 있으며, 연구 과정에 필요한 분석 도구와 컴퓨팅 자원을 제공합니다.
연구자는 연구 목적에 따라 적절한 연구 환경을 선택할 수 있으며, 권한이 부여된 데이터 및 분석 자원에 한하여 접근할 수 있습니다.
7.1.1 제공되는 분석 환경 종류
연구 환경은 연구 목적이나 분석 방식 또는 분석 규모에 따라 선택 가능한 다양한 애플리케이션을 제공합니다.
연구자는 연구 포털 메인화면의 “RESEARCH INFRA” 탭을 통해 제공되는 분석 환경의 리스트를 확인할 수 있으며, 필요한 애플리케이션을 실행하여 데이터 분석 및 연구를 수행할 수 있습니다.

Virtual Computing Environment (VCE)는 가상화 기술을 기반으로 연구자가 대화형 분석 및 데이터 탐색을 수행할 수 있는 환경을 제공합니다.
- Jupyter Notebook: 코드 작성, 실행 및 결과 시각화를 하나의 문서에서 수행할 수 있는 대화형 분석 환경입니다. 연구자는 Python 기반으로 데이터를 반복적으로 탐색하고 연구 과정을 기록할 수 있습니다.
- JupyterLab(임시): Jupyter Notebook의 확장형 인터페이스를 제공하며, 여러 파일과 분석 세션을 동시에 관리할 수 있는 통합 개발 환경을 제공합니다. 연구자는 복수의 데이터셋과 분석 결과를 동시에 관리할 수 있습니다.
- RStudio(임시): 통계 및 데이터 처리, 시각화를 통합적으로 수행할 수 있는 R language 기반 분석 환경을 제공합니다.
HPC Computing Environment (HPC) 는 대용량 데이터 분석 및 고성능 연산을 수행할 수 있는 애플리케이션을 제공합니다.
- Terminal(임시): 명령어 기반 분석 환경으로 HPC 자원에 직접 접근하여 작업을 수행할 수 있는 환경을 제공합니다. 연구자는 분석 프로그램 실행, 데이터 관리 및 배치 작업을 수행할 수 있습니다.
- Nextflow Workflow Environment(임시): 복잡한 분석 파이프라인을 자동화하여 실행할 수 있는 Nextflow 기반 실행 환경을 제공합니다. 연구자는 분석 워크플로우를 정의하고 대규모 데이터셋에 대해 반복 가능한 분석을 수행할 수 있습니다.
- AI/ML Computing Environment(임시): 머신러닝 및 딥러닝 모델 개발을 지원하는 환경을 제공합니다. GPU 및 고성능 연산 자원을 활용하여 모델 학습과 추론을 수행할 수 있습니다.
각 환경은 사용자 편의성과 보안을 동시에 고려하여 제공되며, 연구 유형 및 기관 정책에 따라 제공 방식이 달라질 수 있습니다. 연구자는 승인된 연구에 대해 자동으로 생성된 연구 환경에 접근할 수 있습니다.
7.2 접속 방법
연구 환경을 이용하기 위해서는 확인된 연구자 계정이어야 하며, 인증 및 보안 절차를 완료하여야 합니다. 연구 데이터의 안전한 수집과 활용을 위하여 가상 네트워크 (Virtual Private Network, VPN) 및 가상 데스크톱 환경 (Virtual Desktop Infrastructure, VDI) 기반의 접속 환경을 제공합니다.
연구자의 데이터 신청이 승인되면 연구 환경이 생성되며, VPN에 접속하고, VDI 환경을 통해 연구 환경에 접근할 수 있습니다. 연구 환경 접속 권한은 사용자 권한 및 프로젝트 설정에 따라 제한될 수 있습니다.
연구 환경 이용 전, VPN 및 VDI 클라이언트가 정상적으로 설치되어 있어야 하며, 네트워크 연결 상태가 안정적인 환경에서 접속하여야 합니다.
7.2.1 VPN/VDI 접속
연구 환경은 연구 데이터의 안전한 활용과 보안 강화를 위해 일반 인터넷 환경이 아닌 VPN 또는 VDI 기반의 접속 방식을 사용합니다.
○ VPN 접속 VPN은 연구자의 단말기와 연구 환경 간 통신을 암호화하여 안전한 네트워크 연결을 제공합니다. 연구자는 VPN 연결을 통해 연구 시스템에 안전하게 접속할 수 있으며, 외부 네트워크 환경에서도 승인된 연구자에 한하여 연구 환경 접근이 가능합니다.
- VPN 접속 절차
- AXGATE 시스템 주소 이동(브라우저 보안 팝업 시, “안전하지 않은 사이트로 이동” 클릭하여 접속)
- VPN 로그인
- VPN 네트워크 설정이 진행되며, “VPN 연결이 완료되었습니다. (100%)” 문구를 통해 VPN 연결 완료 확인

○ VDI 접속 가상 데스크톱 환경을 통해 연구자는 원격으로 제공되는 가상 컴퓨터에 접속하여 연구를 수행할 수 있습니다. 연구자의 개인 PC에는 데이터가 저장되지 않으며 연구 데이터 및 분석 결과는 폐쇄된 연구 환경에 저장되어 관리됩니다.
- VDI 접속 절차
- VDI 주소 접속
- VDI 로그인
- Google 보안 OTP 입력
- 접속 버튼을 통해 Virtual machine 실행


7.3 환경 구성
연구 환경은 연구자가 데이터를 효율적으로 관리하고 분석을 수행할 수 있도록 표준화된 디렉토리 구조를 제공합니다. 연구자는 프로젝트별 작업 공간 내에서 데이터 저장, 분석 수행 및 결과 관리를 체계적으로 수행할 수 있습니다.
연구 환경 내 디렉토리는 데이터 유형 및 용도에 따라 구분되어 있으며, 각 디렉토리 의 목적에 맞게 파일을 저장하고 관리할 수 있습니다.
7.3.1 디렉토리 구조
연구 환경은 프로젝트 단위의 작업 공간을 기반으로 구성되며, 일반적으로 원본 데이터, 분석 데이터, 결과 파일 및 연구자 작업 파일을 구분하여 관리합니다. 고유한 목적을 갖는 디렉토리를 통해 사용자는 데이터의 용도에 따라 적절한 위치를 선정하여 저장할 수 있습니다.
디렉토리는 다음과 같은 구조로 구성됩니다.
Project
- Data /
- Analysis /
- Result /
- Reference /
- Temp /
7.3.2 데이터 위치
연구 환경에서 제공되는 데이터는 데이터 유형 및 권한에 따라 지정된 저장 위치에 관리됩니다. 연구자는 권한이 부여된 데이터에 한하여 접근할 수 있으며, 데이터 위치는 프로젝트 설정 및 연구 유형에 따라 달라질 수 있습니다. 데이터는 다음과 같은 형태로 제공됩니다.
- VCF
원본 데이터는 지정된 데이터 저장소에 보관되며, 무단 수정 또는 삭제가 제한 됩니다.
7.4 소프트웨어 및 도구
연구 환경에서는 데이터 분석 및 연구 수행을 지원하기 위하여 다양한 분석 도구를 제공합니다. 연구자는 제공되는 분석 도구를 활용하여 워크플로우 기반 분석 및 결과 해석을 수행할 수 있습니다.
제공되는 분석 도구는 연구 환경 내에서 실행할 수 있으며, 사용자 권한 및 연구 환경 설정에 따라 이용 가능한 도구가 달라질 수 있습니다.
7.4.1 분석 툴 목록
연구 환경은 다양한 연구 목적과 데이터 해석을 지원하기 위하여 여러 분석 도구를 제공합니다.

연구자는 적합한 도구를 선택하여 분석을 수행할 수 있습니다.
- Galaxy (Workflow): Galaxy Workflow는 사전에 정의된 분석 절차를 기반으로 데이터 분석을 수행할 수 있는 워크플로우 기반 분석 도구입니다. 연구자는 개별 분석 프로그램을 직접 실행하지 않고, 미리 구성된 분석 워크플로우를 선택하여 일관된 분석 절차를 수행할 수 있습니다. 이를 통해 복잡한 분석 과정을 자동화하고 분석 결과의 재현성을 확보할 수 있습니다. 연구자는 제공된 워크플로우를 선택하거나 권한에 따라 사용자 정의 워크플로우를 활용할 수 있습니다.
- Exomiser: Exomiser는 희귀질환 및 유전질환 연구를 위한 후보 변이 우선순위 분석 도구입니다. 유전체 변이 정보와 표현형 정보를 통합 분석하여 질환과 관련 가능성이 높은 후보 유전자 및 변이를 탐색할 수 있습니다.
연구 목적 및 서비스 확장, 설치/추가 요청에 따라 추가 분석 도구를 제공할 수 있으며, 최신 제공 도구 목록은 연구 환경 내 소프트웨어 관리 화면에서 확인할 수 있습니다.
7.4.2 설치 및 추가 요청
연구 환경에서 제공되지 않는 소프트웨어 또는 분석 도구가 필요한 경우 연구자는 추가 설치를 요청할 수 있습니다.
추가 요청 기능은 연구 수행이 필요한 분석 환경을 확장하기 위한 목적으로 제공되며, 요청된 소프트웨어는 운영 정책 및 보안 검토를 거쳐 제공될 수 있습니다.
설치 요청 시에는 다음 정보를 입력하여야 합니다.
- 소프트웨어 또는 도구 명
- 버전 정보
- 활용 목적
- 라이선스 정보
- 연구 과제 또는 프로젝트 정보
- 기타 사유
요청이 승인되면 연구 환경에 해당 도구가 설치되거나 사용 가능한 형태로 제공될 수 있습니다. 또한 분석 과정에서 필요한 라이브러리, 패키지 또는 워크플로우 추가 구성 시, 별도의 요청 절차를 통해 지원받을 수 있습니다.
설치 가능 여부는 시스템 자원, 운영 정책, 라이선스 조건 및 보안 검토 결과에 따라 달라질 수 있습니다.
7.5 보안 정책
연구 환경은 연구 데이터의 기밀성, 무결성 및 안전한 활용을 보장하기 위하여 엄격한 보안 정책을 적용하고 있습니다. 연구자는 연구 환경 이용 시 관련 법령, 기관 규정 및 시스템 보안 정책을 준수하여야 하며, 허가되지 않은 데이터 접근, 복제, 반출 또는 공유 행위를 수행할 수 없습니다.
7.5.1 데이터 반출 제한
연구 환경 내 데이터는 보안 정책에 따라 관리되며, 원본 데이터 및 분석 과정에서 생성된 산출물에 대한 외부 반출이 제한될 수 있습니다.
연구자는 연구 환경 내에서 제공되는 데이터에 대해서만 접근 및 분석이 가능하며, 별도의 승인 절차 없이 데이터를 외부 저장장치 또는 외부 시스템을 이동할 수 없습니다.
데이터 반출 제한의 주요 목적은 다음과 같습니다.
- 연구 대상자 정보 보호
- 민감한 정보의 유출 방지
- 데이터 무단 복제 방지
- 안전한 연구 데이터 관리
- 관련 법령 및 규정 준수
반출 대상 파일은 시스템의 반출 승인 절차에 따라 검토될 수 있으며, 승인된 자료에 한하여 외부 반출이 가능합니다.
반출 신청 시에는 다음과 같은 정보를 제출하여야 합니다.
- 반출 대상 파일
- 반출 목적
- 활용 목적
- 연구 과제 정보
- 반출 요청자
관리자는 데이터의 민감성, 개인정보 포함 여부 및 연구 목적 적합성을 검토한 후 반출 승인 여부를 결정하며 다음과 같은 진행 상태를 포함합니다.
- 임시저장
- 신청
- 유해 검출
- 회수
- 반려
- 검토대기
- 승인
승인되지 않은 데이터의 복사, 다운로드, 캡쳐 또는 외부 전송은 제한되며, 관련 정책 위반 시 서비스 이용이 제한될 수 있습니다.
7.5.2 로그 기록
안정적인 서비스 운영과 사용자 계정 보호를 위하여 연구 환경 이용 이력이 기록 및 관리됩니다. 로그 기록은 연구 데이터의 안전한 활용을 지원하고, 연구자 보안을 확보하기 위한 목적으로 활용됩니다.
기록된 로그는 서비스 운영, 보안 사고 대응 및 연구 이력 관리에 필요한 범위 내에서만 활용되며, 관련 법령 및 개인정보 보호 정책에 따라 안전하게 관리됩니다.
로그 기록의 주요 목적은 다음과 같습니다.
- 사용자 계정 보호
- 비인가 접근 방지
- 연구 이력 관리
- 서비스 오류 분석 및 복구 지원
- 연구 데이터의 안전한 활용 지원
위 항목에 의거하여 연구 환경 이용 과정에서 발생하는 주요 활동 정보가 기록될 수 있습니다.
- 로그인 및 로그아웃 이력
- 연구 환경 및 프로젝트 접근 기록
- 분석 도구 수행 이력
- 데이터 반출 이력
- 분석 결과 생성 이력
- 시스템 설정 변경 이력
기록된 정보는 서비스 제공 및 보안 관리에 필요한 최소한의 범위 내에서 수집되며, 연구자의 개인적인 작업 내용이나 연구 과정은 수집되거나 모니터링 되지 않습니다. 로그 정보는 권한이 부여된 관리자단 수준에서 접근할 수 있으며, 사용자 개인정보 및 연구정보 보호를 위하여 암호화 및 접근 통제 정책이 적용됩니다.
연구자는 본인의 연구 활동 이력을 확인할 수 있으며, 이를 통해 수행한 분석 내역 및 작업 기록을 관리할 수 있습니다.
본 시스템은 연구자 개개인의 프라이버시 및 권리를 존중하며, 관련 법령 및 내부 보안 정책에 따라 로그 정보를 안전하게 관리합니다. 로그 정보는 보관 기간 경과 또는 보관 목적 달성 시 관련 규정에 따라 안전하게 폐기됩니다.