Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Set
- 데이터입수
- 지하철역좌표
- GNN
- 도커 레이어
- MESH
- Python
- python최단거리
- 동명이인찾기
- GIS
- 그리드분할
- 파이썬
- osmnx
- geojson
- 컨테이너
- pyvista
- 귀여운고래
- GCN
- geopandas
- 3d
- 도커
- 패치분할
- 좌표거리
- STL
- graph
- 3d데이터
- 알고리즘
- docker
- 이미지빌드
- 폴더조사
Archives
- Today
- Total
목록수치형 (1)
이것저것 기록
[python, ML] scikit-learn을 사용하여 학습/테스트 데이터 전처리하기
한동안 데이터 분석 쪽을 엄청 파다가, 요즘은 머신러닝을 공부하고 있다. 머신러닝은 이미 엄청나게 성능이 좋은 프레임워크가 많이 개발 돼 있고, 또 이것들이 사용하기 편하게 라이브러리로 전부 제공하고 있다. (그래서 나는 생각보다 쉽게 쉽게 배우고 있다. 적어도 딥러닝 처음 배울 때만큼 막막하진 않은 듯?) 머신러닝 모델은 사이킷런에서 그냥 함수 갖다쓰듯이 사용하면 되기 때문에, 사실 머신러닝을 적용할 때에 가장 중요한 부분은 '데이터 전처리'인 것 같다. 그래서 오늘은 내가 강의를 들으면서 배운 머신러닝 모델에 데이터를 넣기 전, 전처리를 도와주는 함수와 내용들을 포스팅 해보려고 한다. 내 돈 주고 공부 중인데 까먹을까봐 이렇게 기록해두려는 목적도 있고...ㅋㅋㅎ 공부하면서 작성한 코드와 샘플 데이터는..
Data Science/ML & DL
2021. 4. 14. 15:00