[EDA] 탐색적 데이터 분석 with Python (2)
·
etc
데이터를 가져오고 추가하고 수정하고 없애고 하는 과정도 중요하지만, Dataframe으로 데이터의 분포와 경향성을 보는 것은 어디까지 한계가 존재한다. 이 데이터를 바탕으로 보기 좋게 시각화를 한다면 경향성이나 이상치, 결측치 등을 확인하기 편할 것이다. matplotlib 말 그대로 수학 그림을 그리는 파이썬 라이브러리이다. 뒤에서 살펴볼 seaborn 또한 matplotlib에 기반을 두므로 시각화를 처음 접할 때 먼저 실습해 보기 좋은 라이브러리다. 근데 결국은 seaborn을 사용하는 게 편리하긴 하다. seaborn matplotlib을 추상화하여 작동하는 라이브러리이므로 사용이 간편하고 좀 더 예쁜 그림들을 쉽게 그릴 수 있으나 미세한 조정에는 결국에 matplotlib을 조금 사용해줘야 한다..
[EDA] 탐색적 데이터 분석 with Python (1)
·
etc
데이터를 다루는 데에 있어서 Exploratory Data Analysis(EDA)는 매우 중요한 자료 분석 방법론이다. 이를 통해 데이터를 살펴보며 여러 중요 지표를 찾을 수 있을 뿐만 아니라 시각화, 나아가 인공지능 학습에 있어서 쓸만한 데이터인지를 판단할 수 있는 과정으로서의 역할도 한다. 빅데이터 분석이나 인공지능 학습의 라이브러리가 대부분 파이썬을 기반으로 하고 있기 때문에 파이썬 기반의 EDA 관련 라이브러리와 문법을 정리해보려 한다. Pandas: Dataframe을 다루는 라이브러리이다. 테이블 위주로 데이터를 보거나 처리할 수 있게 도와준다.Numpy: 수치 데이터를 다룰 때 매우 유용한 라이브러리이다. 통계 계산이 빠르고 효율적이다.Matplotlib & Seaborn: 데이터를 시각화..
[GitHub] 깃허브 시작하기 - Repository 생성
·
etc
Git에 대한 이해는 충분하나, 매번 레포를 생성할 때마다 혹시 몰라 찾아 보는 게 귀찮아서 아예 작성을 한다. 원격 레포지토리 생성깃허브에 로그인하고, New repository를 만든다. Description은 그냥 보조 설명. 써두면 남들이 보기에 편하다. 원격 레포지토리에서 README.md, .gitignore을 미리 추가하고 clone하여 시작하는 방법도 있지만, 나는 로컬 레포지토리를 먼저 생성하고 로컬에서 해당 파일을 만들어 준 후에 원격 레포지토리와 연결할 예정이다. 로컬 레포지토리 생성 후 연결1. 레포지토리를 위한 디렉토리 생성 후 해당 디렉토리로 이동mkdir ai-basics-pytorchcd ai-basics-pytorch2. git 초기화(생성)git init3. README...
[GitHub] MacOS 업데이트 후 Git 에러가 발생할 때 (xcrun: error)
·
etc
맥이 업데이트되고 나서는 항상 git을 다룰 때 xcrun: error가 발생합니다. 뭔가 항상 빠진 듯 .. 터미널을 실행하고 해당 명령어를 통해 명령어 라인 개발자 도구를 설치해주면 끝. xcode-select --install
100두산
'etc' 카테고리의 글 목록