일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- geojson
- 패치분할
- 컨테이너
- Python
- 폴더조사
- 도커
- GNN
- 귀여운고래
- pyvista
- MESH
- docker
- 3d
- 데이터입수
- 이미지빌드
- 좌표거리
- python최단거리
- 동명이인찾기
- STL
- 도커 레이어
- GCN
- 알고리즘
- graph
- osmnx
- 그리드분할
- 3d데이터
- 파이썬
- geopandas
- GIS
- Set
- 지하철역좌표
- Today
- Total
목록전체 글 (86)
이것저것 기록

파이썬에는 문자열 값을 변수 이름으로 변환할 수 있는 방법 중 exec()이 있다. 나는 이 내장함수를 변수명을 굳이 assign해서 값을 할당하기에는 한번 쓰고 버려질(?) 변수에 사용하는 편이다. 또한 변수 특정 조건을 만족하는 변수명이 생성되었을 때 동적으로 함수를 적용하고 싶을 때 사용한다. 사용법은 간단하다. 임의로 작성한 다음 코드를 살펴보자. name_ls = ['Mat', 'David', 'Sam', 'Christina', 'Alex', 'Hiland', 'Maddy'] age_dict = {'Mat':10, 'David':15, 'Sam':16, 'Christina':20, 'Alex':17, 'Hiland':5, 'Maddy':9} logic_age = """ age = age_dict..

서울시 지하철역 좌표와, 그 지하철역을 지나는 호선 정보를 포함한 데이터가 없어서 만들었습니다. 두 가지 데이터를 사용하여 구축하였습니다. 수도권 지하철역 좌표: han.gl/wKbCB 서울시 노선별 지하철역 좌표: data.seoul.go.kr/dataList/OA-15442/S/1/datasetView.do 데이터와 코드는 깃헙에 올려놨으니 참고해주세요! github.com/henewsuh/subway_crd_line_info henewsuh/subway_crd_line_info 지하철역 좌표와 노선 정보를 통합하는 코드. Contribute to henewsuh/subway_crd_line_info development by creating an account on GitHub. github.com..

한동안 데이터 분석 쪽을 엄청 파다가, 요즘은 머신러닝을 공부하고 있다. 머신러닝은 이미 엄청나게 성능이 좋은 프레임워크가 많이 개발 돼 있고, 또 이것들이 사용하기 편하게 라이브러리로 전부 제공하고 있다. (그래서 나는 생각보다 쉽게 쉽게 배우고 있다. 적어도 딥러닝 처음 배울 때만큼 막막하진 않은 듯?) 머신러닝 모델은 사이킷런에서 그냥 함수 갖다쓰듯이 사용하면 되기 때문에, 사실 머신러닝을 적용할 때에 가장 중요한 부분은 '데이터 전처리'인 것 같다. 그래서 오늘은 내가 강의를 들으면서 배운 머신러닝 모델에 데이터를 넣기 전, 전처리를 도와주는 함수와 내용들을 포스팅 해보려고 한다. 내 돈 주고 공부 중인데 까먹을까봐 이렇게 기록해두려는 목적도 있고...ㅋㅋㅎ 공부하면서 작성한 코드와 샘플 데이터는..

Choropleth 도란 색상이나 패턴을 사용하여 특정 통계에 대한 데이터를 사전 정의된 영역과 관련시켜 시각화 한 지도 유형이다. 이러한 지도 시각화는 점 데이터로 표현된 정보 보다는, 특정 구역에 대한 통계 데이터를 시각화 하는 데에 적절하다. 예를 들어, 서울시 구 별 교통사고 건수, 구 별 소득, 등등 '지역 별 통계'를 지도에 시각화 하기 좋다. 최근 두 번의 데이터 분석 경진대회를 참가하면서, 의외로 이 choropleth map을 그릴 일이 많았다. 나는 plotly라는 라이브러리를 사용했는데, 이 라이브러리의 다큐멘트가 매우 불친절하다 ^^ 그리고 이 라이브러리에서도 choropleth 함수를 샘플 데이터와 함께 업로드 한 포스팅을 찾을 수가 없어서, 엄청 애먹으면서 습득했다... 오늘 사..

데이터 간 거리를 측정하는 방법에는 여러 가지 방법이 있다. 거리를 측정하는 이유는, 데이터 간 거리가 '유사도'를 나타내기 때문이다. 오늘은 다음 링크에서 소개하는 데이터 유사성 측정방법을 나열해보려고 한다. towardsdatascience.com/9-distance-measures-in-data-science-918109d069fa 9 Distance Measures in Data Science The advantages and pitfalls of common distance measures towardsdatascience.com 머신러닝 (혹은 딥러닝)을 다루게 된다면 데이터들 간 유사도 측정은 거의 필수이기 때문에 이렇게 정리 해놓으면 내가 (혹은 누군가가) 언젠가 유용하게 쓰게 될 거라 믿..