본문 바로가기

생활의 정보화/인공지능( AI : Artificial Intelligence)

한 번에 따라하는 데이터 분석 기초 완주반 수강 일지(5)

반응형

데이터 처리 라이브러리인 Pandas의 홈페이지

 이번 주에는 파이썬 라이브러리에 대한 학습 결과를 적어본다.

이제야 제목 그대로 데이터 분석에 대한 강의를 듣게 되었다.

데이터 분석 프로그램이 주로 파이썬의 라이브러리로 구성되었다.

파이썬이 AI 분야에서 도보적인 언어이다.

그 이유는

첫째, 뛰어난 확장성과 연계 호환성을 가졌다고 한다. 즉 파이썬은 분석 영역을 넘어 머신 러닝 기반의 다양한  개발이 용이하다고 한다. 그뿐만 아니라 기존의 앱과도 연계가 쉽다고 한다.

둘째, 딥 러닝 프레임워크들이 파이썬 기반으로 작성되었다는 점이다. 대부분의 딥러닝 관련 튜토리얼, 설명 자료들이 파이썬으로 작성 제공된다고 한다.

이러한 이유로 딥 러닝을 학습하기 위한 최적의 언어는 파이썬이라고 강사님은 자신 있게 주장한다.

그에 따른 라이브러리 강의는 수치 계산 라이브러리인 Numpy, 데이터 처리 라이브러리인 Pandas, 데이터 시각화 라이브러리인 Matplotlib와 Seaborn, 웹 데이터 수집 라이브러리인 BeautifulSoup, 머신러닝 라이브러리인 Scikit Learn, 그리고 파이썬 코드 작성과 실행을 위한 툴인 Python Juputer Notebook, 마지막으로 Google Drive와 주피터 노트북이 결합된 Google Colaboratory(Colab)에 대하여 강의 받았다.

데이터 분석에 꼭 필요한 라이브이리라 생각되었다.

그런데 문제는 강의 속도가 조금 바라서 따라가기가 쉽지 않았다. 가장 큰 이유로 2-3번의 코딩 연습으로 응용 과정인 라이브러리를 이해하기엔 조금 무리가 있었다. 프로그램 언어의 문법, 많은 명령어의 종류를 기억하기가 조금 어려웠다. 아마 많은 프로그램 작성을 통한 훈연이 필요할 것으로 생각되었다. 잘 가르쳐 주신 강사님에게 건의가 있다면 이미 배운 내용이라도 나올 때 마다 설명해 주시면 감사하겠다. 

아무튼 남은 2주간에 열심히 복습해서 파이썬 프로그램을 잘 사용할 수 있으면 좋겠다.

 

 

반응형