공부해볼라는 스토리

  • 홈
  • 태그
  • 방명록

Python #KFold #StratifiedKFold #sklearn 1

[ML] KFold와 Stratified-KFold 기법

이번에 데이콘을 진행하면서 제공되는 Train set, Test set으로 머신러닝을 수행했는데, 데이터셋에 대한 고민을 많이 했다. 근데 이번 학습 데이터셋은 2880 col X 598 row 형태로 features는 매ㅐㅐㅐ우 많은데 데이터 양은 절대적으로 적었다ㅜㅜ 그리고 multi-classfication이라 레이블이 3개인데 굉장히 불균형했다,,,, 그래서 학습 데이터셋을 이용해서 검증 데이터셋 (validatation set)을 구성할 때 좀 더 유의해야하는 부분이 존재했다. sklearn에서는 K-Fold CV (Cross Validation)을 구현하기 위한 2가지 클래스인 KFold와 stratifiedKFold가 제공된다. 우선 K-Fold CV란, 데이터셋을 K개의 fold로 분리해서..

ML\DL/Machine Learning 2023.03.13
이전
1
다음
더보기
프로필사진

NLP 잘하고 싶다 https://github.com/HyeLynnKIM

  • 분류 전체보기 (141)
    • ML\DL (19)
      • LGAimers (13)
      • Machine Learning (2)
      • Deep Learning (2)
    • Algorithm (68)
      • BOJ (22)
      • Programmers (14)
      • SQL (9)
      • STUDY (17)
    • Python (13)
      • Error (9)
    • NLP (29)
      • Transformers for NLP (5)
      • Paper Review (14)
      • Do it! ~ NLP (5)
    • DataAnalysis (1)
    • Latex\Overleaf (1)
    • Github (4)
      • Git (0)
      • Markdown (2)
    • Etc (4)
    • 취준 (0)

Tag

lstm #binary분류 #python, error #python #runtimeerror #grad_fn #requres_grad, Programmers #SQL #MySQL #Oracle, linux #한영전환키 #xrdp #Hangul, Error #RuntimeError #tensor, cuda #tensorflow #cuda10.0 #gpu, if, python #re #정규표현식 #정규식, TRY, bash #conda #activate, Python #KFold #StratifiedKFold #sklearn, NLP #GLUE #GLUE TASK #NLU, latex #overleaf #chicago #reference, NLP #QA #EMNLP #SQuAD, programmers, python #error #torch, python,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/08   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바