_대문 | 방명록 | 최근글 | 홈피소개 | 주인놈
FrontPage › CategoryMachineLearning

Contents

[-]
1 개념
2 자료 수집과 준비(Data Collection & Preparation)
3 기술통계(Descriptive Statistics)
4 탐색적 데이터 분석(Exploratory Data Analysis)
5 추정(Estimation)
6 가설 검정(Hypothesis Testing)
7 회귀(Regression)
8 분류(Classification)
9 군집(Clustering)
10 시각화
11 서비스
12 참고자료


작성중...
Python으로 해보려고는 하고 있는데.. 아직까지 R이 훨씬 편한다.. 아.. 하기 싫다..


다음 그림은 개략적인 데이터 분석의 흐름을 보여준다. 통계와 머신 러닝의 경계가 모호하고 분명히 교집합[1]이 있지만,
  • 통계(Statistics): 추정(Estimation), 가설 검증(Hypothesis Testing)
  • 머신 러닝(Machine Learning): 분류(Classification), 군집(Clustering), 회귀(Regression)
과 같이 분류하면 조금은 편할 것 같다.
data_analysis.png


import pandas as pd
import numpy as np

3 기술통계(Descriptive Statistics) #

아.. python으로 해야 하나? 난 SQL과 Excel이 훨씬 편하단 말이야..

목적
  • 데이터의 이해를 위해 시각화하고 요약
  • 데이터의 특성 및 분포 파악

데이터 살펴보기

4 탐색적 데이터 분석(Exploratory Data Analysis) #


5 추정(Estimation) #


6 가설 검정(Hypothesis Testing) #

9 군집(Clustering) #

12 참고자료 #



저도 파이선을 배워볼려고 내가 알고 있는 기술통계부터 시작하려다가 턱 막혀 버렸네요. R에선 한줄이면 되는 것이 파이선에서는...ㅠㅠ
결국 데이터 전처리나 기술통계, 일반 통계 등은 R을 사용하고 머신러닝이나 딥러닝 고급은 파이선을 사용하는 것이 맞지 않을까 싶은 생각이 듭니다. 요즘... -- 김종헌 2021-07-23 21:41:47
----
   [1]  대표적으로 회귀(Regression)이 그렇다
   [2]  데이터 분석을 위해 데이터를 import해야 한다. 경험적으로는 다음의 3가지가 대부분이다.
   [3]  pandas의 dataframe이나 series에서 데이터를 주무르는 방법들
   [4]  R에서의 sqldf와 비슷한 것

댓글 남기기..
이름: : 오른쪽의 새로고침을 클릭해 주세요. 새로고침
EditText : Print : Mobile : FindPage : DeletePage : LikePages : Powered by MoniWiki : Last modified 2022-09-21 04:26:34

아직도 내가 더 자라야 하는 나무로 남아 있다는 것이 얼마나 자랑스럽고 기쁜 일인가. 내 능력을 더 키울 수 있는 위치에 있다는 것이 더 없이 행복한 일이라는 것을 알고 산다면 조금도 사는 일에 조급하지 않을 것이다. 아직도 능력 없는 사람이라는 것을 아직도 희망을 가져도 좋은 사람이라는 의미로 바꿔보자. (김이연)