Serendipity

이해는 잠시만 있다가 하실게요.👋

그래서 일단 기록합니다.

3-(1) 결정 트리의 장점과 단점은 무엇인가요?

(1) 결정 트리의 장점과 단점은 무엇인가요? # 들어가며 예시 답안 (코드잇 제공) 결정 트리는 데이터의 속성을 바탕으로 결정 경로를 만들고, 그 결과를 통해 예측을 수행하는 머신러닝 모델입니다. 결정 트리의 가장 큰 장점은 모델의 결과를 이해하기 쉽다는 것입니다. 트리의 형태로 결정 과정을 시각적으로 나타낼 수 있어, 어떤 속성이 결과에...

2-(4) K-폴드 교차 검증에서 K의 값을 선택할 때 고려해야 할 점

(4) K-폴드 교차 검증에서 K의 값을 선택할 때 고려해야 할 점은 무엇인가요? # 들어가며 예시 답안 (코드잇 제공) K-폴드 교차 검증에서 K의 값을 선택할 때는 데이터셋의 크기, 계산 비용(리소스), 분산과 편향의 균형, 데이터의 특성 등을 종합적으로 고려해야 합니다. 일반적으로 5-폴드나 10-폴드 교차 검증이 많이 사용됩니다. 데...

2-(3) 모델 학습시 발생할 수 있는 bias와 variance에 대해.

(3) 모델 학습 시 발생할 수 있는 편향과 분산에 대해 설명하고, 두 개념의 관계에 대해 설명해 주세요. # 들어가며 예시 답안 (코드잇 제공) 편향과 분산은 Trade-off 관계에 있습니다. 즉, 하나를 줄이면 다른 하나가 증가하는 경향이 있습니다. 모델의 성능을 최적화하려면 이 둘 사이의 균형을 잘 맞춰야 합니다. 고편향, 저분산: ...

2-(2) 손실 함수(loss function)란 무엇이며, 왜 중요한가요?

(2) 손실 함수(loss function)란 무엇이며, 왜 중요한가요? # 들어가며 예시 답안 (코드잇 제공) 손실함수는 머신러닝 모델의 예측값과 실제값 사이의 차이를 수치적으로 나타내는 함수입니다. 이 함수의 값(손실)을 최소화하는 것이 모델 학습의 주요 목표입니다. 손실함수를 통해 모델의 성능을 평가하고, 이를 통해 모델이 데이터를 얼마나...

2-(1) 지도 학습과 비지도 학습의 차이

(1) 지도 학습과 비지도 학습의 차이는 무엇인가요? # 들어가며 예시 답안 (코드잇 제공) 지도 학습은 입력 데이터와 해당 정답 레이블을 함께 사용하여 모델을 학습시키는 방식입니다. 이를 통해 모델은 주어진 입력에 대해 올바른 출력을 예측할 수 있도록 학습합니다. 예를 들어, 사진에 있는 물체를 분류하는 것이 지도 학습의 예입니다. 반면,...

1-(3) 대표적인 데이터 전처리 방법인 결측값, 중복값, 이상치 처리에 대해

🟢 (3) 대표적인 데이터 전처리 방법인 결측값, 중복값, 이상치 처리에 대해 각각 설명해 주세요. ⚪ 들어가며 데이터 전처리(Preprocessing)는 데이터를 본격적으로 활용하기 위한 어떤 작업을 하기 전에 미리 processing을 하는 과정이다. 과거 대학원 시절에도 이 preprocessing은 실험의 결과를 좌우한다고 해도 과언이 아닐 ...

1-(2) EDA(Exploratory Data Analysis)란

🟢 (2) EDA(Exploratory Data Analysis)란 무엇인가요? ⚪ Intro 현재 스프린트 과정에서는 머신러닝의 초입 단계인 데이터 분석 단계를 진행중이다. 대표적으로 pandas라는 통계 패키지를 활용하여 각종 데이터를 분석해보는 실습을 진행중에 있다. 개인적으로 예전에 머신러닝 수업을 몇개 듣기도 했고 코드잇 국비지원으로 데이터...

1-(1) 선형대수학이란 어떤 학문이며, 왜 머신러닝에 필요한지

🟢 (1) 선형대수학이란 어떤 학문이며, 왜 머신러닝에 필요한지 설명해보세요. ⚪ Intro 선형대수학(Linear Algebra)는 개인적으로 애착이 있는 과목이고 학부~대학원 시절까지 여러번 나를 괴롭혔던 과목이기도 하다. 그래서 개인적으로 이 주제가 나왔을때 할말이 정말 많아서 어떤 것부터 얘기할까 고민을 하다가 데드라인에 쫓겨서 두서 없이 한...

© 2025 Soohyun Jeon ⭐

🌱 Mostly to remember, sometimes to understand.