코딩공부(22)
-
XGBoosting
AdaBoost(적응 부스팅) 약한 학습기(일반적으로 결정 트리 또는 스텀프)의 시리즈를 사용하여 강력한 학습기를 생성합니다. 각 후속 모델은 이전 모델의 오류를 보정하기 위해 오분류된 샘플의 가중치를 조정합니다. 최종 예측은 모든 약한 학습기의 예측을 결합하여 가중치를 적용한 후에 이루어집니다. Gradient Boost(그레이디언트 부스팅) Leo Breiman의 관찰로부터 유래되었으며, 부스팅을 비용 함수에 대한 최적화 알고리즘으로 볼 수 있습니다. 일련의 의사결정 트리를 구축하며, 각 트리는 이전 트리의 잔차(오류)를 보정하려고 합니다. 모든 트리의 예측을 결합하여 최종 예측을 수행합니다. XGBoost(eXtreme Gradient Boosting) 그레이디언트 부스팅의 최적화된 및 확장 가능한..
2024.04.05 -
Linear Regression(회귀 분석)
회귀분석에서 추론 1. 표본으로부터 얻은 회귀선은 모집단으로부터 얻은 회귀선과 다를 수 있다. 2. 우리가 원하는 것 회귀선이 플롯을 얼마나 잘 설명하는지 평가 모집단 회귀선의 기울기를 추측 주어진 X 값에 대한 Y 값 추측 단일 변수 테스트 Newspapers와 Sales 사이에 다른 변수들을 고려한 후에도 선형관계가 있는지 확인 전체 회귀가 무언가를 설명하고 있는지 확인하는 F 테스트: 모든 기울기가 0인지 여부를 결정
2024.04.05 -
클러스터링 요약
클러스터링은 데이터 집합 내에서 하위 그룹 또는 클러스터를 찾는 기술 집합입니다. 이는 X와 Y가 둘 다 알려진 지도학습과는 달리 X만 알려진 비지도 학습의 일부입니다. 좋은 클러스터링은 그룹 내의 관측치가 유사하지만 그룹 간에는 매우 다른 경우입니다. 주로 사용되는 두 가지 클러스터링 방법은 K-Means 클러스터링과 계층적 클러스터링 입니다. K-Means는 원하는 클러스터 수 K를 지정한 다음 각 관측치를 정확히 K개의 클러스터 중 하나에 할당합니다. 클러스터 내의 원소들이 유사하도록 하는 것이 목표입니다. 계층적 클러스터링은 클러스터 수를 선택할 필요가 없으며 관측치를 나타내는 트리 기반 표현인 덴드로그램을 생성합니다. 이 방법은 클러스터링 결과를 해석하고 선택하는데 도움이 되는 정보를 제공합니다..
2024.04.05 -
ORM(Object-relational mapping, 객체 관계 매핑)이란?
ORM은 데이터베이스의 데이터를 객체와 연결해주는 기능이다. Django ORM에서 Model 클래스는 데이터베이스의 테이블을 연결시켜주며, Model 클래스의 objects 속성은 데이터베이스 명령인 SQL쿼리(SQL Query)를 사용할 수 있게 해준다.
2024.01.19 -
JS 세미콜론(;) 삽입: 코드 작성 시 유의할점
세미콜론(';')은 JS에서 문장의 끝을 나타내는 중요한 구분 기호입니다. 그러나 흥미로운 점은 대부분의 경우, 개발자가 세미콜론을 직접 쓰지않아도 자바스크립트 엔진이 자동으로 삽입한다는 것입니다. 이러한 기능을 '세미콜론 자동 삽입' 이라고 합니다. 세미콜론 자동 삽입이 작동하는 경우 세미콜론 자동 삽입은 다음과 같은 경우에 작동합니다. : 줄 바꿈이 있는 '}'나 ')', ']' 뒤 줄 바꿈이 있는 '++', '--' 연산자 뒤 줄 바꿈이 있는 '+', '-', '*', '/', '=' 등의 이항연산자 뒤 줄 바꿈이 있는 'continue', 'break', 'return', 'thorw'등의 키워드 뒤 이러한 규칙을 이해하면 자바스크립트 코드를 작성할 때 세미콜론을 명시적으로 쓰지 않아도 되는 상황..
2023.10.17 -
머신러닝에 대하여
머신러닝이란? 머신러닝(기계 학습)은 주어진 문제에 대해 컴퓨터가 자체적으로 학습하여 예측결과를 생성하고 문제를 해결하는 방법입니다. 이는 단순히 문제 해결에 그치는 것이 아니라, 해당 문제 해결을 위한 전체적인 구조를 의미합니다. AI와 딥러닝(심층 학습)은 머신러닝과 더불어 최근 기술 발전의 주요 주제가 되었습니다. 많은 사람들이 '인공지능 = 딥러닝'으로 오해하고 있지만, 딥러닝은 머신러닝 알고리즘의 하나일 뿐입니다. 머신러닝은 학습 대상에 따라 다양한 알고리즘을 사용하는데, 예를 들어 지도 학습, 비지도 학습, 강화 학습 등이 있습니다. 이는 데이터를 기반으로 컴퓨터가 패턴을 인식하고 의사 결정을 내릴 수 있는 모델을 만들어냅니다. 이를 통해 많은 분야에서 예측, 분류, 클러스터링 등의 작업을 수..
2023.10.15