본문 바로가기
TIL _Today I Learned/2024.07

[DAY 12][특강] 학습 데이터의 유형 및 서비스 적용 사례

by gamdong2 2024. 7. 26.
[천재교육] 프로젝트 기반 빅데이터 서비스 개발자 양성 과정 9기
* 특강 : 학습 데이터의 유형 및 서비스 적용 사례
학습일 : 2024.07.24

📕 학습 목록

  • 분석/AI 모델 개발에 필요한 데이터의 유형/형태
  • 에듀테크에 사용되는 데이터 유형; 캘리퍼
  • 프로세스 마이닝

 

📗 기억할 내용

 

1) 분석/AI 모델 개발에 필요한 데이터의 유형/형태 

 

① 텍스트 데이터 (Text Data); 자연어 처리(NLP) 모델 개발에 주로 사용됨
  - ex : 학생 에세이, 교과서 내용, 퀴즈 질문과 답변, 포럼 글, 학습 피드백
  - 형태 : 텍스트 파일 (TXT), CSV 파일, JSON, XML
  - 적용 분야 : 자동 채점 시스템, 맞춤형 학습 경로 추천, 텍스트 요약, 언어 학습 도우미, 질의응답 시스템

② 이미지 데이터 (Image Data); 컴퓨터 비전 모델 개발에 사용됨
  - ex : 교육용 이미지, 스크린샷, 도형 및 그래프 이미지, 교과서 삽화
  - 형태 : 이미지 파일 (JPEG, PNG, BMP, TIFF)
  - 적용 분야 : 이미지 기반 퀴즈, 시각적 학습 도구, 자동 채점(그림 및 그래프), 증강 현실(AR) 학습 도구

③ 오디오 데이터 (Audio Data); 음성 인식 및 음성 처리 모델 개발에 사용됨
  -  ex : 강의 녹음, 언어 학습 오디오, 팟캐스트, 오디오북
  - 형태 : 오디오 파일 (MP3, WAV, FLAC)
  - 적용 분야 : 음성 인식 기반 언어 학습, 강의 요약, 청각 장애인을 위한 자막 생성, 음성 피드백 시스템

④ 비디오 데이터 (Video Data); 비디오 분석 및 동작 인식 모델 개발에 사용됨
  - ex : 강의 비디오, 교육용 동영상, 실습 영상, 학생 프레젠테이션
  - 형태 : 비디오 파일 (MP4, AVI, MKV)
  - 적용 분야 : 비디오 기반 학습, 강의 요약, 실습 평가, 학생 참여도 분석, 실시간 피드백 제공

⑤ 센서 데이터 (Sensor Data); IoT 및 스마트 기기 관련 모델 개발에 사용됨
  - ex : 웨어러블 기기 데이터(심박수, 활동량), 학습 환경 센서 데이터(온도, 조도)
  - 형태 : CSV 파일, JSON, 실시간 스트림 데이터
  - 적용 분야 : 맞춤형 학습 환경 제공, 학생 건강 모니터링, 학습 집중도 분석

⑥ 시계열 데이터 (Time Series Data); 시간에 따라 변화하는 데이터를 분석하는 모델 개발에 사용됨
  - ex : 학생 성적 기록, 학습 활동 로그, 출석 기록, 학습 시간 데이터
  - 형태 : CSV 파일, 데이터베이스, JSON
  - 적용 분야 : 학습 진도 추적, 성적 예측, 출석 분석, 학습 패턴 분석, 이상 감지(부진한 학생 식별 등)

* 데이터 준비 과정
   : 데이터 수집 → 정제 → 전처리 → 분할 → 증강 

2) 에듀테크에 사용되는 데이터 유형

  • Caliper Analytics : 학습 분석을 위한 수집 프레임워크
[Caliper Analytics]
- 정보 모델(학습활동, 이벤트 및 관련 속성,..을 설명) & 어휘를 정의
- 다양한 학습 환경에서 발생하는 데이터를 수집하기 위해 개발됨
- 통제된 단일 인터페이스인 Sensor API 를 통해 데이터를 수집하는 방법을 함께 제공
  • xAPI(Experience API) : e-Learning과 학습 경험을 기록•추정하는 데 사용되는 표준 API
[xAPI]
- 학습 활동의 데이터를 기록 & 학습자의 경험을 자세히 추적
- 교수자는 학습자의 학습 • 수행과정에서의 피드백 • 주석 을 실시간으로 관찰, 전송, 수신 가능
- 데이터 모델 : 트리플 구조(Actor, Verb, Object)를 기반으로 한 기술문 활용

 

3) 프로세스 마이닝

  • 프로세스 마이닝 : 정보 시스템에 기록된 이벤트 로그를 분석 → 실제 비즈니스 프로세스의 수행과정을 추적/모델링/개선하는 기법
  • 조직이 실제 업무 프로세스를 이해하고 최적화하는 데 도움을 줌

① 프로세스 마이닝의 목표 

[목표]
- 프로세스 발견 : 실제로 수행된 프로세스를 이벤트 로그에서 추출하여 프로세스 모델을 생성
- 프로세스 검증 : 실제 수행된 프로세스와 사전에 정의된 프로세스 모델을 비교하여 일치 여부를 확인하고, 불일치를 식별
- 프로세스 향상 : 이벤트 로그를 분석하여 프로세스의 효율성과 효과성을 향상시킬 수 있는 개선 방안을 도출


② 프로세스 마이닝의 구성 요소

[구성 요소]
- 이벤트 로그 : 프로세스 마이닝의 기본 데이터 소스로, 각 이벤트는 고유한 사건을 나타냄
- 프로세스 모델 : 이벤트 로그에서 추출한 프로세스의 시각적 표현으로, 프로세스의 흐름을 나타냄

 

③ 프로세스 마이닝의 주요 기법

[주요 기법]
- 알파 알고리즘 (Alpha Algorithm) : 이벤트 로그로부터 직접 프로세스 모델을 추출하는 기본적인 알고리즘
- 추적 기반 마이닝 : 유사한 사례들을 군집화하여 프로세스 변이를 분석함. 이를 통해 다양한 변형 프로세스를 식별할 수 있음



📙 내일 일정

  • 데이터 전처리 & 데이터 시각화 복습

 

 

'TIL _Today I Learned > 2024.07' 카테고리의 다른 글

[DAY 14] IT 프로젝트, Python 실습  (0) 2024.07.30
[DAY 13] Python 실습  (0) 2024.07.29
[DAY 11] Plotly, Folium  (0) 2024.07.25
[DAY 10] Data Visualization  (0) 2024.07.24
[DAY 9] Data Preprocessing, Data Visualization  (0) 2024.07.23